Home / ITスキル / Pythonメモ:書籍ビジネスPython超入門ウェブスクレイピングのサンプルコード(変数名は異なる)
python

Pythonメモ:書籍ビジネスPython超入門ウェブスクレイピングのサンプルコード(変数名は異なる)

#urllibのrequestモジュールをインポート
import urllib.request

#正規表現(re)モジュールをインポート
import re

#対象URLを変数urlに入れる
url = 'https://www.nikkei.com/markets/kabu/'

#変数responseに、urllibのリクエストモジュールで変数urlに入れたURLを開いて入れる
response = urllib.request.urlopen(url)

#変数htmlに、変数responseのhtmlファイルをutf-8で読み込む
html = response.read().decode('utf-8')

#変数reg_exに、スクレイピングしたい該当箇所をメタ文字を使って表現し、入れる
reg_ex = re.compile('<span class="mkc-stock_prices">(\d+[,.])*\d+</span>')

#変数matched_resultに、変数reg_exに入っている正規表現で変数htmlから抜き出し、入れる
matched_result = reg_ex.search(html)

#変数result_1st_hitに、変数matched_resultに格納されている抜き出し結果の最初の値を入れる
result_1st_hit = matched_result.group(0)

#当該最初の値を表示する
print(result_1st_hit)

#<span>等の余計なコードを取り除く
result_1st_hit = re.sub('<.*?>', '', result_1st_hit)

#日経平均株価:xxxと表示されるようにする
print('日経平均株価:' + result_1st_hit)

 

Amazonサイト

 

Check Also

Djangoメモ:Templates – base.htmlの作成方法及びBootstrapを適用させる方法

コンテンツ: 基本形Boots …