以前のリビジョンの文書です
====== pythonの備忘録 ====== ---- ===== 気象庁HPの各地のアメダス表形式のデータ(.html)から気圧情報を抜き出したい ===== * http://www.jma.go.jp/jp/amedas_h/today-61286.html?areaCode=000&groupCode=44 * 先にwgetでとってきておいて、名前を 20150401.htmlとかに変えておく <code python> #coding:utf-8 ### 引数に元のhtmlをfull pathで渡す ( ./GetPressure.py /home/aaa/..../bbb/20150401.html ) import sys from bs4 import BeautifulSoup argvs = sys.argv argc = len(argvs) if (argc != 2): print "Usage : python %s filename.html"%argvs[0] quit() soup = BeautifulSoup( open(argvs[1]) ) trs = soup.find('table', { "id" : "tbl_list" }) pressure = [] # 各時間の気圧値を入れるための配列を準備 for tr in trs.findAll('tr')[2:]: tds = tr.findAll('td') pressure.append(tds[len(tds)-1].string) f = open("/home/aaa/..../bbb/Pressure.dat","a") # 出力先ファイルを開く("a"は追記モード) f.write("\n") f.write(argvs[1].replace("/home/aaa/..../bbb/","").replace(".html","")) # 日付部分をファイルに書き込み for x in pressure : f.write( " " + x.replace(u"\xa0"," ")) # 各時間の気圧をスペース区切りでファイルに書き込み f.close() </code>