python

Pythonメモ:書籍ビジネスPython超入門ウェブスクレイピングのサンプルコード(変数名は異なる)

#urllibのrequestモジュールをインポート
import urllib.request

#正規表現(re)モジュールをインポート
import re

#対象URLを変数urlに入れる
url = 'https://www.nikkei.com/markets/kabu/'

#変数responseに、urllibのリクエストモジュールで変数urlに入れたURLを開いて入れる
response = urllib.request.urlopen(url)

#変数htmlに、変数responseのhtmlファイルをutf-8で読み込む
html = response.read().decode('utf-8')

#変数reg_exに、スクレイピングしたい該当箇所をメタ文字を使って表現し、入れる
reg_ex = re.compile('<span class="mkc-stock_prices">(\d+[,.])*\d+</span>')

#変数matched_resultに、変数reg_exに入っている正規表現で変数htmlから抜き出し、入れる
matched_result = reg_ex.search(html)

#変数result_1st_hitに、変数matched_resultに格納されている抜き出し結果の最初の値を入れる
result_1st_hit = matched_result.group(0)

#当該最初の値を表示する
print(result_1st_hit)

#<span>等の余計なコードを取り除く
result_1st_hit = re.sub('<.*?>', '', result_1st_hit)

#日経平均株価:xxxと表示されるようにする
print('日経平均株価:' + result_1st_hit)

 

Amazonサイト

 

About TIER

TIERは、Global、DX、HRの3軸により 大手企業から中小企業、民間企業から行政まで、海外展開に必要なサービスをワンストップで支援しております。海外マーケティングセールスからデジタルマーケティング、多言語サイトや越境ECサイト制作等の海外向けクリエイティブ制作、グローバル人材採用支援まで幅広く対応しております。お気軽にお問い合わせください。

Check Also

python

Python: リスト・タプル・辞書の使い方

複数の値を一つの変数で管理でき …