スキップしてメイン コンテンツに移動

[Python]個別銘柄の時系列データをGoogle Financeから取得するプログラム

今日書いたのはこれ。

Google Financeから証券コードを指定して日別の価格情報を取得するプログラムです。
米国市場に上場している銘柄であればCSVでダウンロードでますが、日本の銘柄はできなかったので作りました。
多くの人はYahoo!Japanから取得しているようなので、あえてGoogle Financeから取得してみました。

ちなみに使えるのは東証に上場している銘柄のみです。(おそらく)
このプログラムと日経225構成銘柄一覧取得プログラムを組み合わせれば、日経225構成銘柄の時系列データが取得できてしまいます。


#!/usr/local/bin/python
# -*- coding:utf-8 -*-

from BeautifulSoup import BeautifulSoup
import urllib2,re,datetime,sys

class googleFinance2CSV(object):
 def __init__(self,ticker):
  '''
  引数で渡されたticker(=証券コード)の時系列データを
  Google Financeから取得してCSV形式で保持する
  CSVの列は'Date','Open','High','Low','Close','Volume'
  '''
  self.ticker = ticker
  self.url = 'http://www.google.com/finance/historical?q=%s&num=200' % str(self.ticker)
  self.csv = str()
  soup = BeautifulSoup(urllib2.urlopen(self.url))
  tablesoup = soup.find("table", {"class":"gf-table historical_price"})
  for trsoup in tablesoup.findAll("tr"):
   if len(self.csv)==0:
    tdsoups = trsoup.findAll("th")
   else:
    tdsoups = trsoup.findAll("td")
   self.csv +=re.sub(r'\n','',','.join([re.sub(r',','',tdsoup.find(text=True)) if tdsoup.find(text=True) else '' for tdsoup in tdsoups])) +'\n'
  #日付が'Sep 7 2011'形式になっているので'20110907'形式に直す
  rows = [row.split(',') for row in self.csv.split('\n')]
  for row in rows:
   if row[0] == 'Date':
    self.csv = ','.join(row)+'\n'
   elif row[0] <> '':
    self.csv += datetime.datetime.strftime(datetime.datetime.strptime(row[0],'%b %d %Y'),'%Y%m%d')+','+','.join(row[1:])+'\n'
 def savefile(self,filepath):
  '''
  引数で渡されたfilepath(=保存先ファイル名のフルパス)に
  CSV形式で保存する
  '''
  f = open(filepath,'w')
  f.write(self.csv)
  f.close()

if __name__=='__main__':
 '''
 コマンドラインで以下のように実行する
 "python googlefinance2csv.py TYO:xxxx"のxxxxに証券コードを入れる
 Cドライブの直下に'TYOxxxx.csv'というファイルができる
 '''
 gf2csv = googleFinance2CSV(sys.argv[1])
 gf2csv.savefile('C:\\'+re.sub(r':','',sys.argv[1])+'.csv')


コメント

このブログの人気の投稿

[Python]redis-pyでRedis Pub/Sub実装

前から面白そうと思っていたRedisのPub/Sub機能。 redis-pyでどう実装すれば使えるか確認してみた。 ■Pub/Subについて http://ja.wikipedia.org/wiki/出版-購読型モデル ■pub.py from redis import StrictRedis def publish(channel,msg): """ redis-pyにはPUBLISHするためのメソッドがないので、 Redisのコマンドをそのまま実行する為のクラスを使う。 """ sr=StrictRedis() """ 第1引数にRedisのコマンド、第2引数以降は そのコマンドの引数をそのままセット """ sr.execute_command("PUBLISH",channel,msg) if __name__=="__main__": # チャネル"hoge"に"Hello"というメッセージを出版(Publish) publish("hoge","Hello") ■sub.py from redis import Redis def listen(channel): r=Redis() ps=r.pubsub() ps.subscribe(channel) while True: for i in ps.listen(): print i["data"] if __name__=="__main__": # チャネル"hoge"を購読(Subscribe) listen("hoge") ■実行方法・実行結果 (ターミナル1-準備) [user@localhost ~]# python sub.py 1 # => チャネ

[OS]VirtualBoxでCentOS6.5(x86_64)がKernel panicを起こした

完全に対処療法。 恥ずかしながら自分では原因がわかっていない。 忘れないようにメモしておく。 いろいろ設定したあと、何度目かの再起動のタイミングでKernel panicが発生して起動しないという事象が発生。 こちらの方法でなんとか起動させて。 [CentOS] SELinux 無効化後のカーネルパニック http://kuni255.blogspot.jp/2013/04/centos-selinux.html こちらの通り、/boot/grub/grub.confに設定を追加。 Kernel panic – not syncing: Attempted to kill init! http://h2np.net/mynotebook/post/130 設定変更後、以下の操作をそれぞれ10回ほど試した限りでは再発していません。  (1)halt+起動 (2)reboot 追記:と思ったらまた発生した。なんかもう解決できる気がしない。

[Python]システムトレード環境

最近、システムトレードをしている。 日本株は、自動売買までは実現できていないが、トレンド分析くらいはできるようになっている。 とりあえず、現時点の環境を整理しておきたい。 ■日本株 H/W:さくらVPS(2GBだったかな?) OS:CentOS6.4(x86_64) 言語:Python DB:SQLite3 データソース: http://www.data-get.com/main/ (有料) データ種別:株価データ、銘柄情報データ、分割併合データ ■FX H/W:DELL T100(6年前のもの)+CPU4コアに換装済+メモリ8GB化済 OS:Windows 7 64bit プラットフォーム:MetatTrader 4 言語:MQL4 取引業者:Alpari Japan ■クライアント H/W:MacBook Pro 13インチ(2010-Mid) 特に不満はないけど、さくらVPSが高い。 自宅のT100は古いけど重い処理をさせるわけじゃない。 そのうちさくらVPSから自宅PCのVirtualBoxかなんかの仮想環境に引っ越す可能性もある。 こんなところ。