以前に Datacamp についての記事を書きました。データサイエンスを目指す上で、SQL・Python(・R)のスキルは必須です。今回は、Datacampの競合といえる『DataQuest』を利用してみた感想を解説します。
DataQuest は、Datacamp同様に英語での提供プラットフォームとなります。日本企業が提供しているプログラミングオンラインも利用しましたが、英語で提供されているプラットフォームが遥かにレベルを超えています。日本語のプラットフォームは(Paiza、プロゲートなど)は初歩を学ぶ上では非常に有効です。しかしそれ以上にレベルを高める学習を提供するプラットフォームが日本には存在しません。
加えて、日本のプラットフォームには、『データアナリスト』『データサイエンティスト』に特化したプラットフォームが存在しません。Python・Rなどのプログラミングは、データアナリスト・データサイエンティストにとって必須スキルとなりますが、同時にPandas、Matplotlibなどのライブラリーを使えることも必須となります。
そのため、『データアナリスト』『データサイエンティスト』としてビジネスレベルのスキルを身につけるためには、海外企業が提供しているプラットフォームに挑戦することをおすすめします。英語に不安な方は、Google Translate Extension などを用いて上手に学ぶことが可能です。
DataQuestとは
Dataquest は、Datacampとは異なり、動画から学ぶのではなく「読んで実際にプログラミングを描いてみる」スタイルを提供しています。トピックを説明している録画済みのビデオはありません。その代わり、書かれた説明はすべて、見事に構成されたインタラクティブな教科書のようなものに明示的に書かれています。
あなたも経験があるかもしれませんが、2倍速で数本のビデオを見ただけで、自分が何かを学んでいると錯覚してしまうことがあります。Dataquestでは、学んだことを応用するまでコースは進みませんので、教材を理解する上での自分の位置を正確に把握することができます。
DataQuestでPythonを学ぶこと
データサイエンティストの道は非常に包括的で、基本的な数学のみを前提としています。まずPythonの基礎を学び、統計学や機械学習を使って予測を行うまでになります。
単なるライブラリのインポートではなく、実際に数学を実装することに重点が置かれています。ライブラリを使用する前に、基本的な統計、確率、機械学習のタスクを実行する関数を作らなければなりません。
最終的に使用方法を学ぶことになるライブラリは、すべてユビキタスなデータサイエンススタックからのものです。NumPy、SciPy、Pandas、Matplotlib、そしてScikit-learnです。
他のプラットフォームでは、多くの基本的なコンポーネントが欠けていたり、理論的に不足していたり、十分なチャレンジ精神がなかったりしました。Dataquestはこれらの欠点を見事に改善しています。Dataquestでは、数学・統計についても網羅されています。確率、統計、微積分、線形代数など、データサイエンスと機械学習のための深いクエストが用意されています。このような部分でも、すべてが応用され、コードで補強されます。
機械学習では、データサイエンティストが知っておくべき基本的なアルゴリズムを学びます。K-Nearest Neighbors、Linear and Logistic Regression、K-means Clustering、Decision Trees、Neural Networksなどです。これらすべてに、それぞれの背後にある数学と直感が散りばめられています。
DataQuestの提供コース
DataQuest は、下記のコースを提供しています。
- Data Analyst
- Data Scientist
- Data Engineer
私は、Data Analystコースで学び始めましたが、途中でData Scientistコースに切り替えました。なぜなら、Data Analystコースで学んだ場合には、Data Analystとしてのキャリアを目指すことができますが、Data Scientistコースで学んだ場合には、Data Scientist・Data Analyst両方でのキャリアを目指すことができるからです。
DataQuestの金額
まだアカウントを作成されていない方は、Dataquestの教材の1/3が無料であることを知っておいてください。私は、まず最初の無料コースに目を通し、フォーマットが好きかどうか、学んでいると感じられるかどうかを確認することを、絶対にお勧めします。
<プレミアム版金額>
月額 $49.00
年間 $399/year
無料版でも多くのことが学べますが、プレミアム版の内容は以下の通りです。
- すべてのコース提供
- すべてのガイド付きポートフォリオプロジェクト
- レジメ添削
- Slackコミュニティサポート
DataQuestの長所・短所
Dataquest は素晴らしいプラットフォームですが、短所もあります。ここでは、いくつかのポイントをご紹介します。
長所
● リーズナブルな価格設定が魅力
● 非常に包括的なカリキュラム
短所
● いくつかのバグがありました。例えば、ガイド付きのプロジェクトに取り組む際、iPythonのカーネルが停止してしまい、何度かページを再読み込みする必要がありました。
● プログラミングを解くには、回答が複数あります。しかしDataQuestが用意した回答を得られないと、そのページの質問が「クリア(合格)」となりません。しかし、回答はすぐみることができ、その回答をコピーし次のページに進むことができます。
● 動画がない
DataQuestを利用する対象者
データサイエンスには包括的なスキルが求められます。SQLやPython(R)だけでなく統計・機械学習の知識も必須となります。DataQuestは、統計・機械学習の学習も提供している素晴らしいプラットフォームだと感じました。
私は、DataCampやYoutubeで、動画を用いての学習も並行していますが、動画でスルーしてしまった内容をDataQuestを利用して、文字と実際のタイピングで、自分の中でしっかり『理解』でき、実際に『使う』ことができるようになったのも確かです。ここのプログラミングの構造は、こうなっていたのか!とアハモーメントがたくさんあります。
もし並行して他のプラットフォームでも学習する場合には、下記の順番をおすすめします。DataQuestはDatacampと比較をして、初心者向けに作られている傾向があります。しかし、Paiza、プロゲートよりもはるかに包括的なスキルが身につけることができます。
1 Paiza、プロゲート
2 DataQuest + Datacamp
前述したとおり、Dataquestの教材の1/3が無料のため、個人的にはまずは無料アカウントで学習を進めることをおすすめします。利用をする中で、もっと学習を進めたい場合には、有料に移行するのがよいでしょう。