今回からはPythonを用いたBUYMAの運営にかかる作業を自動化、効率化していく方法をお伝えしていきます。
まず001からではBUYAMAのショッパーを始めた方が必ず通る、モデリングの自動化を目指していきます。
モデリングを普通にやろうとするとかなりの時間がかかる。。。
今回はあまり進めすぎず、とりあえずBUYAMAからパーソナルショッパー登録しているユーザページを取得する方法を記載します。
以下の例ではユーザID6000000からID6100000までの中でパーソナルショッパー登録しているユーザのページを取得しています。
※基本的にBUYMAのユーザーIDは連番で採番されています。(確証ではない。。)
import requests
import configparser
import csv
import sys
config = configparser.ConfigParser()
config.read('config.ini')
section_url = 'url'
def GetList():
userlist = list()
home_url = config.get(section_url, 'home')
for i in range(0,100000):
print(i)
num = 6000000 + i
str_num = str(num)
rq_url = home_url + str_num + '.html'
res = requests.get(rq_url,allow_redirects=False) #リダイレクトさせない
if res.status_code == 200: #ステータスが200のURLのみ取得する
userlist.append(rq_url)
#取得したListをCSV出力
try:
f = open('output.csv','w')
writer = csv.writer(f, lineterminator='\n')
writer.writerow(userlist)
f.close()
except Exception as ex:
f.close()
print(ex)
finally:
f.close()
if __name__ == '__main__':
GetList()
[url]
home = https://www.buyma.com/buyer/