先日、総務省統計局から、API機能で利用可能な統計データが拡充されたというメールマガジンが届きました。
以前、給与計算や労働保険・社会保険手続きの仕事をしていた関係で、給与・労働関係の統計資料には大変興味があります。
- 国税庁 民間給与実態統計調査
- 厚生労働省 賃金構造基本統計調査
- 厚生労働省 毎月勤労統計調査
色々と調べているうちにスライドが見つかったので、これらに従ってブラウザ上にデータを表示させてみよう思いました。
しかし、どういうわけかマニュアルに従ってやったわりには、給与・労働関係の統計データを表示させることはできません。謎だ(汗
国勢調査の統計表情報と統計データの表示
仕方がないので、従前からあった総務省の国勢調査を例として、データを表示させてみました。
統計表情報の取得(XML形式)
以下のURLをブラウザに入力して実行すると、ブラウザ上にXML形式のデータが表示されます。
http://statdb.nstac.go.jp/api/1.0b/app/getStatsList?appId=xxxxx&statsCode=00200&searchWord=‘国勢調査’
?以下のパラメータは以下の通り。
getStatsList: 統計表情報取得のURI appId:利用者のアプリケーションIDを指定。IDはユーザ登録を行い取得 statsCode:政府統計コードを指定。5桁の場合は作成機関名(00200は総務省を表す) searchWord:表題、メタ情報等に含まれるキーワードを検索するパラメータ
統計データ取得(XML形式)
以下のURLをブラウザに入力して実行すると、ブラウザ上にXML形式のデータが表示されます。
http://statdb.nstac.go.jp/api/1.0b/app/getStatsData?appId=xxxxx&statsDataId=0000030003&cdCat01From=000&cdCat01To=001
?以下のパラメータは以下の通り。
getStatsData:統計データ取得のURI appId:利用者のアプリケーションID statsDataId:統計表IDを指定。統計表情報のタグの中にある cdCat01From:分類事項01から抽出するコードを指定(開始) cdCat01To:分類事項01から抽出するコードを指定(終了)
上記のURLは、昭和55年国勢調査 第1次基本集計 全国編のうち、「総人口・日本人(2),男女の別(性別)(2),年齢各歳階級(122),出生の月(5),人口 全国・市部・郡部・都道府県(47),全域・人口集中地区別」のデータを呼び出しています。
統計データ取得(JSON形式)
http://statdb.nstac.go.jp/api/1.0b/app/json/getStatsData?appId=xxxxx&statsDataId=0000030003&cdCat01From=000&cdCat01To=001
appの後ろにjsonという文字列を入力すると、json形式のデータが表示されます。
気になる点が3つ
データの呼び出しをしている上で、気になった点を3つあげておきます。
1.給与・労働関係のデータを呼び出せない
これは冒頭で述べた通りです。
2.表示されるまでの時間が長い
TwitterのStreamingAPIのデータでも1秒ぐらいで返ってきますが、今回の例では10秒ぐらいかかりました。国勢調査だからなのかもしれません(汗(汗
【追記 2014/11/3】
後日、表示される速度を調べたところ、1秒で表示されることもありました。表示速度はサーバーへのアクセス数によるのかもしれません。
3.データによっては数値が入っていない
国勢調査とは別に労働力調査の統計データも、上記のURLにもとづいて表示させようとしましたが、肝心の数値データが入っていませんでした。これも謎(泣
画像を見るとエラーメッセージをお知らせするタグが入っています。もともと数値データが入ってなかったのでしょうか?
知識ゼロからの状態から、この記事を書き上げるまで約半日を費やしました。政府統計データのAPI機能を利用してアプリを作りたいとお考えの方は、どうぞこの記事を「踏み台」にしてください(泣(泣
〔参考サイト〕