【Python】seleniumでHTMLソースを取得するpage_sourceコマンド

目次

ドライバで開いているページのHTMLソースを取得する

seleniumを使ってスクレイピングをしている際に、ドライバが開いているページのHTMLコンテンツを取得したいときにはpage_sourceコマンドを使用します。

例として、このブログのトップページのHTMLコンテンツを取得するには以下のようなコマンドで実現できます。

from selenium import webdriver

#ドライバの起動
chrome_path = "ドライバのパス"
driver = webdriver.Chrome(chrome_path)

#えだはのブログにアクセス
url = "https://edaha-room.com/"
driver.get(url)

#えだはのブログのHTMLソースを取得
html_contents = driver.page_source

#ドライバを閉じる
driver.quit()

print(html_contents)

※私がよく間違えるのですが、page_sourceの後ろに括弧をつけてdriver.page_source()としないでください。正しいコードで書かないと次のようなエラーを吐きます。

TypeError: ‘str’ object is not callable

よかったらシェアしてね!

この記事を書いた人

えだはのアバター えだは ITエンジニア

2001年生まれの♂。愛知県出身。
国立大学の情報学科を卒業後、某ユーザ系IT企業に就職。
2022年に当ブログ「えだはの部屋」を開設。
ブログ収益は100円〜1000円の間で常に低空飛行をしており、基本赤字。
将来の夢は億万長者。

コメント

コメントする

目次