• HOME
  • 医学一般
  • 医療統計学
  • Python/Excel/SQLによる 経済・経営分析のためのデータ処理入門**東京図書/原 泰史/978-4-489-02394-1/9784489023941**

Python/Excel/SQLによる 経済・経営分析のためのデータ処理入門**東京図書/原 泰史/978-4-489-02394-1/9784489023941**

販売価格
3,520円(税込み)
編著
原 泰史
出版社
東京図書
分野
 
医療統計学

数量

販売期間
2023/07/10~
商品コード
9784489023941
発行 2023年7月
判型:B5判変型 320頁
ISBN 978-4-489-02394-1

気の利いた「下ごしらえ」が、鋭いデータ分析の決め手です!

データサイエンスを行う前に必要な、データそのものを集める様々な方法や手続きを紹介。経済学や経営学の理論やフレームワークを用いたデータ分析に関心のある読者が、日々の中でデータを見つけ出す方法を手助けします。主な内容:1.Web APIやスクレイピング、Linked Open Dataを用いてデータを取得する方法、2.SQLを用いてデータを保持し、そこから自らが欲しいデータを入手する方法、3.ExcelやPythonを用いてデータを処理する方法など。

【目 次】
第1章 データを分析する前の、「下ごしらえ」の方法
  1.1 はじめに
  1.2 データ分析の流れ
  1.3 様々なデータベースのご紹介
  1.3.1 企業のデータベース
  1.3.2 マーケティング関連のデータベース
  1.3.3 生産・販売・調達のデータベース
  1.3.4 研究開発のデータベース
  1.4 分析ツールと分析環境をどうする?
  1.5 データ分析の道具をどう使い分ける?
  1.6 本書で扱う事例について
  1.7 本書の読み進め方
  1.8 生成型AI(ChatGPT, Bing, Google Bard) でデータを探す
  1.8.1 ChatGPT3.5
  1.8.2 Microsoft Bing
  1.8.3 Google Bard
 
第2章 すべてはExcel からはじめよう
  2.1 はじめに
  2.2 下準備
  2.3 if 関数を利用する
  2.4 データの型を変更する
  2.5 sum 関数を利用する
  2.6 sumif 関数を利用する
  2.7 SUMIFS 関数を利用する
  2.8 VLOOKUP 関数を利用する
  2.9 AVERAGE 関数を利用する
  2.10 AVERAGEIF 関数を利用する
  2.11 MEDIAN 関数で中央値を求める
  2.12 MODE関数で最頻値を求める
  2.13 MAX関数で最大値を求める
  2.14 MIN 関数で最小値を求める
  2.15 PERCENTILE.INC 関数で値の傾向を確認する
  2.16 ヒストグラムの図を作成する
  2.17 ピボットテーブルで値を「まとめなおす」
  2.18 CSV データをダウンロードしてExcel に取り込む
  2.18.1 パターン1: 素直にそのままExcel で開く
  2.18.2 パターン2: インポートウィザードを用いる
  2.19 最後にExcelの限界を知る
 
第3章 Python を使ってデータをみつけよう
  3.1 はじめに
  3.1.1 利用しているパッケージのバージョンについて
  3.2 Web スクレイピング: Pandas DataFrame を用いる
  3.3 Web スクレイピング: BeautifulSoup を用いる
  3.4 楽天API を利用して、楽天市場で提供する商品情報を入手する
  3.4.1 楽天市場の情報を入手する
  3.4.2 楽天トラベルの情報を入手する
  3.4.3 楽天レシピの情報を入手する
  3.5 法人情報に緯度経度情報を付与して、地図にプロットする
  3.5.1 データを入手する
  3.5.2 緯度経度情報を付与する
  3.6 Yahoo! API を用いて分類や駅までの距離の情報を取得する
  3.6.1 はじめに: Yahoo! Japan アカウントの作成
  3.6.2 Jupyter Notebook 上でのAPI の利用
  3.7 Linked Open Data (LOD)
  3.7.1 Wikipedia(DBpedia) からデータを集めてくる
  3.7.2 日本のアニメのデータを集めてくる
 
第4章 SQLで大規模データを管理・活用しよう
  4.1 はじめに: SQL で色々なデータを管理する
  4.2 MySQL とMySQLWorkbench のインストール方法(Windows11編)
  4.3 MySQL のインストール方法(MacOS 編)
  4.4 MySQLWorkbench のインストールおよび初期設定for Mac
  4.4.1 バイナリをダウンロードする
  4.4.2 MySQLWorkbench にアカウントを設定する
  4.4.3 ユーザを作成する
  4.5 MySQL でデータを処理: 法人企業情報データの集計
  4.5.1 リレーショナルデータベースとは
  4.5.2 スキーマを作成する
  4.5.3 Table Data Import を使ってみる
  4.5.4 基本情報のテーブルを作成する
  4.5.5 Where 文を用いてデータを選択する
  4.5.6 表彰(prize) テーブルを作成する
  4.5.7 テーブルに表彰データをインポートする
  4.5.8 表彰情報と基本情報をInner Join で接合して分析する
  4.5.9 都道府県ごとの企業数をカウントする
  4.5.10 閉鎖した企業数を都道府県ごとにカウントする
  4.5.11 閉鎖した企業数を年ごとにカウントする
  4.5.12 都道府県ごとに閉鎖した企業数をカウントする
  4.5.13 企業の設立年ごとにデータを抽出する
  4.5.14 企業の創業年ごとに集計する
  4.6 Stata にSQL で集計したデータを取り込む
  4.7 Excel にSQL で集計したデータをインポートする
  4.8 Python にSQL のデータを読み込む
  4.9 Google Big Query の使い方
  4.9.1 Big Query サンドボックスを利用する
  4.9.2 Big Query パブリックデータからデータを取得する
  4.9.3 Looker Studio で可視化する
  4.9.4 Google Colab でデータ処理する
  4.9.5 Google Spreadsheet でデータの集計を行う
 
困ったときの逆引き事典
  (1) Python で基本的なプログラミング構文を学ぶ
   1 標準出力
   2 数値演算
   3 データ型の変換
   4 for 文
   5 enumerate 文
   6 zip 文
   7 enumerate とzip 文を一緒に使う
   8 for 文を用いた多重ループ
   9 itertools を使った多重ループ
   10 if 文
   11 論理演算子
   12 while 文
   13 無限ループと例外処理
  (2) pip でパッケージを導入する
  (3) パッケージのバージョンを確認する
  (4) 砂場からダイヤモンドを探す(エラーの倒し方)