今回は前回(003)でからさらに取得項目を増やし、BUYMAのパーソナルショッパーページから以下の情報を取得する方法を公開します。
取得項目
- ユーザ名
- 総合評価
- 丁寧さ
- 返信の早さ
- 梱包の丁寧さ
- 発送までの平均日数
- 販売履歴
- 買い付け成功率
- 評価(満足)
- 評価(どちらでもない)
- 評価(不満)
- 出品商品数
- 出品者登録日
import requests from lxml import html import configparser import os def GetUsers(): config = configparser.ConfigParser() config.read('./buymaDB_env/config.ini') #section = 'url' url = config.get('url', 'sample') rs = requests.get(url) root = html.fromstring(rs.text) username = root.xpath('//*[@id="buyer_name"]/h1/a') evaluation = root.xpath('//*[@id="left_wrap"]/div/div/span') polit = root.xpath('//*[@id="detailed_list"]/li/div/p') respose = root.xpath('//*[@id="detailed_list"]/li/div/p') packing = root.xpath('//*[@id="detailed_list"]/li/div/p') shippingdate = root.xpath('//*[@id="detailed_list"]/li/div/p') salesnum = root.xpath('//*[@id="detailed_list"]/li[5]/div/p') offersuccess = root.xpath('//*[@id="detailed_list"]/li[6]/div/p') evaluation1 = root.xpath('//*[@id="evallink_wrap"]/ul/li/dl/dd/a') evaluation2 = root.xpath('//*[@id="normal"]/dl/dd/a') evaluation3 = root.xpath('//*[@id="evallink_wrap"]/ul/li/dl/dd') exhibit = root.xpath('//*[@id="left_wrap"]/div/dl/dd/a/span') registdate = root.xpath('//*[@id="profile_txt"]/dd') print(username[0].text) #ユーザ名 print(evaluation[0].text) #総合評価 print(polit[0].text) #丁寧さ print(respose[0].text) #返信の速さ print(packing[0].text) #梱包の丁寧さ print(shippingdate[0].text) #発送までの平均日数 print(salesnum[0].text) #販売履歴 print(offersuccess[0].text) #買い付け成功率 print(evaluation1[0].text) #満足 print(evaluation2[0].text) #どちらでもない print(evaluation3[0].text) #不満 print(exhibit[0].text) #出品商品数 print(registdate[0].text) #出品者登録日 if __name__ == "__main__": GetUsers()