スキップしてメイン コンテンツに移動

[Python][Google App Engine]日本株式個別銘柄の日足+出来高CSVダウンロード

久しぶりにGAE/Pythonを触ってみた。
Python2.7も対応で、マルチスレッド?同時リクエスト処理?にも対応してた。

早速作ってみたのはこれ↓
『証券コードと営業日数を指定してやると4本値+出来高が取得できるプログラム』

■使い方
URLに下記のように条件を指定してEnterキーをたたいてください。
http://test-004.appspot.com/dlhistorical?ticker=証券コード&days=営業日日数
※最大で450日分まで遡って取得できます。

例)
スターバックス(2712)の過去400営業日の日別データがほしい場合
http://test-004.appspot.com/dlhistorical?ticker=2712&days=400

すると、日別情報が画面に表示されますので、これをExcelに張り付ければ分析に役立ちますね!

■処理内容
裏側でhttpリクエスト実行
BeautifulSoupでHTMLパースしてtableをCSV化
検索条件でmemcacheにset
※2回目以降同じ条件のリクエストにはmemcacheから返す

■課題
GAE側ではmemcacheのみでデータ保持で遅い
memcacheが必ずしも最新の情報ではない可能性あり
裏のhttpリクエスト制約のせいで450件が最大日数

■参考
すぐに試せるリンクを作っておきます。
2012/2/24の東証1部出来高上位5銘柄の過去100営業日のデータです。

みずほ(8411)の過去100営業日分
http://test-004.appspot.com/dlhistorical?ticker=8411&days=100

三菱UFJ(8306)の過去100営業日分
http://test-004.appspot.com/dlhistorical?ticker=8306&days=100

野村HD(8604)の過去100営業日分
http://test-004.appspot.com/dlhistorical?ticker=8604&days=100

新日鉄(5401)の過去100営業日分
http://test-004.appspot.com/dlhistorical?ticker=5401&days=100

東電(9501)の過去100営業日分
http://test-004.appspot.com/dlhistorical?ticker=9501&days=100

何かあれば、コメントやTwitterで質問いただければと思います。

コメント

このブログの人気の投稿

[Mac]Time Machineのバックアップ先をWindows共有フォルダに設定する

こんばんは。もっくんです。 2台あったWindowsのデスクトップを1台にまとめるついでに、ずっと放置していたMacのバックアップ環境を構築してみました。Finderでコピペするだけでいいんですが、どうせなら「Mac全体を自動的にバックアップします。」という謳い文句のTime Machineを使いたい。 Apple純正のTime CapsuleやUSBの外付けHDDという手もあったんですが、ノートの機動性を落としたくなかったし、なによりタダでできそうなWindows共有フォルダにネットワーク越しにバックアップする方法を取ることにしました。 実際の流れは下記のようになります。 ネットワーク共有フォルダを作成する 空のディスクイメージを作成する ネットワーク共有フォルダにディスクイメージをコピーする ネットワーク共有フォルダのディスクイメージをマウントする マウントしたディスクイメージをTime Machineのバックアップ先に指定する 1.ネットワーク共有フォルダを作成する この手順はそこまで面倒ではないので、簡単な手順だけ。 Windows全体の設定でファイル共有を有効にする(Windowsで作業) Macと共有(Macから見えるように)したいフォルダを作成する(Windowsで作業) 共有したいフォルダに共有設定をする(Windowsで作業) 共有フォルダに接続(Macで作業) 詳細はこちらの記事が画像付きでわかりやすい。 http://blog.goo.ne.jp/beosound/e/7d6d0d0a8f76035f880001eda06c4247 2.空のディスクイメージを作成する いわばこのディスクイメージがバックアップ先のHDDの代わりとなる。 アプリケーション > ユーティリティ > ディスクユーティリティを起動 画面上部の ファイル > 新規 > 空のディスクイメージをクリック 設定画面の各欄は以下のように設定 名前: TimeMachineVolume(なんでもよい) 保存先: デスクトップ(ローカルのわかりやすい場所) ボリューム名: TimeMachineVolume(なんでもよい) ボリュームサイズ: カスタム

[Python]個別銘柄の時系列データをGoogle Financeから取得するプログラム

今日書いたのはこれ。 Google Finance から証券コードを指定して日別の価格情報を取得するプログラムです。 米国市場に上場している銘柄であればCSVでダウンロードでますが、日本の銘柄はできなかったので作りました。 多くの人はYahoo!Japanから取得しているようなので、あえてGoogle Financeから取得してみました。 ちなみに使えるのは東証に上場している銘柄のみです。(おそらく) このプログラムと 日経225構成銘柄一覧取得プログラム を組み合わせれば、日経225構成銘柄の時系列データが取得できてしまいます。 #!/usr/local/bin/python # -*- coding:utf-8 -*- from BeautifulSoup import BeautifulSoup import urllib2,re,datetime,sys class googleFinance2CSV(object): def __init__(self,ticker): ''' 引数で渡されたticker(=証券コード)の時系列データを Google Financeから取得してCSV形式で保持する CSVの列は'Date','Open','High','Low','Close','Volume' ''' self.ticker = ticker self.url = 'http://www.google.com/finance/historical?q=%s&num=200' % str(self.ticker) self.csv = str() soup = BeautifulSoup(urllib2.urlopen(self.url)) tablesoup = soup.find("table", {"class":"gf-table historical_price"}) for trsoup in tablesoup.findAll("tr&qu

[Python]redis-pyでRedis Pub/Sub実装

前から面白そうと思っていたRedisのPub/Sub機能。 redis-pyでどう実装すれば使えるか確認してみた。 ■Pub/Subについて http://ja.wikipedia.org/wiki/出版-購読型モデル ■pub.py from redis import StrictRedis def publish(channel,msg): """ redis-pyにはPUBLISHするためのメソッドがないので、 Redisのコマンドをそのまま実行する為のクラスを使う。 """ sr=StrictRedis() """ 第1引数にRedisのコマンド、第2引数以降は そのコマンドの引数をそのままセット """ sr.execute_command("PUBLISH",channel,msg) if __name__=="__main__": # チャネル"hoge"に"Hello"というメッセージを出版(Publish) publish("hoge","Hello") ■sub.py from redis import Redis def listen(channel): r=Redis() ps=r.pubsub() ps.subscribe(channel) while True: for i in ps.listen(): print i["data"] if __name__=="__main__": # チャネル"hoge"を購読(Subscribe) listen("hoge") ■実行方法・実行結果 (ターミナル1-準備) [user@localhost ~]# python sub.py 1 # => チャネ