#urllibのrequestモジュールをインポート import urllib.request #正規表現(re)モジュールをインポート import re #対象URLを変数urlに入れる url = 'https://www.nikkei.com/markets/kabu/' #変数responseに、urllibのリクエストモジュールで変数urlに入れたURLを開いて入れる response = urllib.request.urlopen(url) #変数htmlに、変数responseのhtmlファイルをutf-8で読み込む html = response.read().decode('utf-8') #変数reg_exに、スクレイピングしたい該当箇所をメタ文字を使って表現し、入れる reg_ex = re.compile('<span class="mkc-stock_prices">(\d+[,.])*\d+</span>') #変数matched_resultに、変数reg_exに入っている正規表現で変数htmlから抜き出し、入れる matched_result = reg_ex.search(html) #変数result_1st_hitに、変数matched_resultに格納されている抜き出し結果の最初の値を入れる result_1st_hit = matched_result.group(0) #当該最初の値を表示する print(result_1st_hit) #<span>等の余計なコードを取り除く result_1st_hit = re.sub('<.*?>', '', result_1st_hit) #日経平均株価:xxxと表示されるようにする print('日経平均株価:' + result_1st_hit)
[button color=”orange” size=”medium” link=”https://amzn.to/2LXsn2a” icon=”” target=”false”]Amazonサイト[/button]