今回は前回(003)でからさらに取得項目を増やし、BUYMAのパーソナルショッパーページから以下の情報を取得する方法を公開します。
取得項目
- ユーザ名
- 総合評価
- 丁寧さ
- 返信の早さ
- 梱包の丁寧さ
- 発送までの平均日数
- 販売履歴
- 買い付け成功率
- 評価(満足)
- 評価(どちらでもない)
- 評価(不満)
- 出品商品数
- 出品者登録日
import requests
from lxml import html
import configparser
import os
def GetUsers():
config = configparser.ConfigParser()
config.read('./buymaDB_env/config.ini')
#section = 'url'
url = config.get('url', 'sample')
rs = requests.get(url)
root = html.fromstring(rs.text)
username = root.xpath('//*[@id="buyer_name"]/h1/a')
evaluation = root.xpath('//*[@id="left_wrap"]/div/div
/span
')
polit = root.xpath('//*[@id="detailed_list"]/li
/div/p')
respose = root.xpath('//*[@id="detailed_list"]/li
/div/p')
packing = root.xpath('//*[@id="detailed_list"]/li
/div/p')
shippingdate = root.xpath('//*[@id="detailed_list"]/li
/div/p')
salesnum = root.xpath('//*[@id="detailed_list"]/li[5]/div/p')
offersuccess = root.xpath('//*[@id="detailed_list"]/li[6]/div/p')
evaluation1 = root.xpath('//*[@id="evallink_wrap"]/ul/li
/dl/dd/a')
evaluation2 = root.xpath('//*[@id="normal"]/dl/dd/a')
evaluation3 = root.xpath('//*[@id="evallink_wrap"]/ul/li
/dl/dd')
exhibit = root.xpath('//*[@id="left_wrap"]/div/dl
/dd/a/span')
registdate = root.xpath('//*[@id="profile_txt"]/dd
')
print(username[0].text) #ユーザ名
print(evaluation[0].text) #総合評価
print(polit[0].text) #丁寧さ
print(respose[0].text) #返信の速さ
print(packing[0].text) #梱包の丁寧さ
print(shippingdate[0].text) #発送までの平均日数
print(salesnum[0].text) #販売履歴
print(offersuccess[0].text) #買い付け成功率
print(evaluation1[0].text) #満足
print(evaluation2[0].text) #どちらでもない
print(evaluation3[0].text) #不満
print(exhibit[0].text) #出品商品数
print(registdate[0].text) #出品者登録日
if __name__ == "__main__":
GetUsers()

