【Python】seleniumでHTMLソースを取得するpage_sourceコマンド

目次

ドライバで開いているページのHTMLソースを取得する

seleniumを使ってスクレイピングをしている際に、ドライバが開いているページのHTMLコンテンツを取得したいときにはpage_sourceコマンドを使用します。

例として、このブログのトップページのHTMLコンテンツを取得するには以下のようなコマンドで実現できます。

from selenium import webdriver

#ドライバの起動
chrome_path = "ドライバのパス"
driver = webdriver.Chrome(chrome_path)

#えだはのブログにアクセス
url = "https://edaha-room.com/"
driver.get(url)

#えだはのブログのHTMLソースを取得
html_contents = driver.page_source

#ドライバを閉じる
driver.quit()

print(html_contents)

※私がよく間違えるのですが、page_sourceの後ろに括弧をつけてdriver.page_source()としないでください。正しいコードで書かないと次のようなエラーを吐きます。

TypeError: ‘str’ object is not callable

よかったらシェアしてね!

この記事を書いた人

えだはのアバター えだは 大学生

国立大学で情報工学を専攻中の22歳の♂。
運営ブログの閲覧者が壊滅的に少ない。

コメント

コメントする

目次