Python 自動処理 -BUYAMA編- 003｜システムブック

前回(002)で取得したパーソナルショッパーのURLから実際に
対象のページを解析し、出品者登録日を取得していきます。

今回webスクレイピングで使用しているモジュールはlxmlです。
選定利用としてはxpathでの指定が可能だったからです。
xpathだとChromeの検証ツールから必要な情報を思考停止で取得出来てしまう。。。。

import requests
from lxml import html
import configparser

def scraping():

    config = configparser.ConfigParser() 
    config.read('config.ini')
    section = 'url'

    url = config.get(section, 'sample')
    rs = requests.get(url)

    root = html.fromstring(rs.text)
    date = root.xpath('//*[@id="profile_txt"]/dd') #今回はxpathで指定
    print(date[0].text) #出品者登録日




if __name__ == "__main__":
    scraping()