ダウンロード
はじめに
ページによってダウンロードされたすべてのアタッチメントに対して、page.on("download") イベントが発行されます。これらのアタッチメントはすべて一時フォルダーにダウンロードされます。イベントから Download オブジェクトを使用して、ダウンロード URL、ファイル名、およびペイロードストリームを取得できます。
ダウンロードされたファイルを永続化する場所は、downloads_path オプションを使用してbrowser_type.launch()で指定できます。
注
ダウンロードされたファイルは、それらを生成したブラウザコンテキストが閉じられると削除されます。
ファイルダウンロードを処理する最も簡単な方法を以下に示します。
- 同期
- 非同期
# Start waiting for the download
with page.expect_download() as download_info:
# Perform the action that initiates download
page.get_by_text("Download file").click()
download = download_info.value
# Wait for the download process to complete and save the downloaded file somewhere
download.save_as("/path/to/save/at/" + download.suggested_filename)
# Start waiting for the download
async with page.expect_download() as download_info:
# Perform the action that initiates download
await page.get_by_text("Download file").click()
download = await download_info.value
# Wait for the download process to complete and save the downloaded file somewhere
await download.save_as("/path/to/save/at/" + download.suggested_filename)
バリエーション
ダウンロードを開始するものが不明な場合でも、イベントを処理できます。
- 同期
- 非同期
page.on("download", lambda download: print(download.path()))
async def handle_download(download):
print(await download.path())
page.on("download", handle_download)
イベントを処理すると、制御フローが分岐し、スクリプトが追跡しにくくなることに注意してください。メインの制御フローがこの操作の完了を待機していないため、ファイルをダウンロード中にシナリオが終了する可能性があります。
注
ファイルのアップロードについては、「ファイルのアップロード」セクションを参照してください。