Python による Web スクレイピングにようこそ!

このドキュメントの資料は https://github.com/takahiromiura/PythonTutorial にあります。

データ分析をするときにデータをどこから取ってきますか?

Web から?その場合は、どうデータにしますか? 手作業で? 少々のデータなら、手作業でできるでしょうが、大規模なデータをとるには、このアプローチは時間か金銭のどちらかを犠牲にしなければならないでしょう。

このドキュメントでは、Python で Web スクレイピング、Web クローリング、つまり、自動で Web からデータをとってきて、それを分析用のデータに落とし込むという作業を行うための基本的な知識を書いてます。

まず最初に、Python とは何かを学んでいきます。 それから、Python の基礎的な文法を学んでいきます。 Python の基礎を学んだら、Python でデータ分析、整理を行うための numpy, pandas について学んでいきます。

Python でデータ分析をできるようになったら、Web ページを書くための言語 HTML について学んでいきます。その後に、Web ページの装飾を行うために使う CSS について学びます。CSS について学ぶことによって、Web ページ上で自分の欲しい情報をどのように取ってくるかがわかるようになります。

Python と Web ページが一通りわかるようになったら、Web スクレイピングの方法に入っていきます。

また、より効率的なプログラミングを行うために、Class の説明, 注意点などを記載した Tips も記載しています。