読者です 読者をやめる 読者になる 読者になる

Carat COOのブログ

遊びからプライベートまで。

「それは人によるんじゃない?」その答えが聞きたいのではない

タイトルから愚痴っぽくなってしまいました。

特に最近あった話ではないのですが、今日ふと思い出したので、思い出したときに書いています。






やっぱり大人になると様々なことが視野に入ってしまうものです。

しかし、今日は一言物申したいと思います。






人生たくさんの人に会ってきました。

十人十色、本当にその言葉が物語るように、個性というものは多かれ少なかれ違うものです。

ただ、今回はこれだけを物申したい。

そうです。それです。











「困ったことない?いつでも相談乗るよ!」

知人の大半は非常に良い人が多く、いつでもこうやって自分のことはお構い無しで気にかけてくれます。

そう言われてから考えると、困ったことはないもので、わざわざ絞り出してまで聞くのも失礼だろうなと思い、「もうすぐ困るから、ぜひそのときに相談させて!」と、人生のポーズボタンをよく発動します。
ゲームコントローラーの真ん中に付いているあのボタンです。





、、、





そして、ついにやってきました。

そうです。
ポーズボタンを押して、スリープを解除するときがやってきました。

困って本当に聞きたいことができたのです。

自分の中で解決できない悩み。

大抵のことは、考えたりネットで調べればほとんど解決するこのご時世。
人に相談したいときは、結構な大事だと思います。





意を決して、相談を持ちかけます。
相談するときは決まって直接会って話してもらいます。
「実はこうこうこうで、、、このあたりに詳しいあなたにお聞きしたいのですが」

そして、一言物申すわけです。




















「それは人によるんじゃない?」















その答えが聞きたいのではない。













いろんな方がいるので、全てに通じる正解はないと思いますが、意を決して質問している人には、少し極論でも答えてもらえると嬉しいです。

『とりあえずディープラーニング』は危険?機械学習を導入する際に抑えておくべき3つのポイント


こちらは『キカガク Online』の記事を、はてなブログ向けに編集してお届けしています。

はじめに

機械学習を使用したい場合は、「まずディープラーニングでいこう」という流れがあります。

それぐらい人工知能機械学習の代名詞となったディープラーニング

果たして毎回ディープラーニングを使用することがベストなのでしょうか。

それとも何も考えずにディープラーニングを使用すると危険なのでしょうか。

「とりあえずディープラーニング」は研究の世界では正解

最近の研究論文事情になるのですが、機械学習系の論文を書く際には、提案するアルゴリズムの性能を評価してアピールする必要があります。

よくされる方法としては、その分野で使用されている有名なアルゴリズム2〜5個程度と比較し、複数の数値例のうち概ね優れている場合は、良い手法ですよといったアピールがされます。

しかし、あくまで相対評価であるため、比較対象のアルゴリズムの性能が良いか悪いかも実際のところよく分っていません。

そんな中、ディープラーニングがここ数年でブレイクスルーを起こしました。

ディープラーニングの良さは何と言っても、内部の構造がほとんどわかっていなくても、自動的に調整して、モデルが構築できるというところ。

これによって、業界ごとに特性が異なるため、それぞれに特化していた機械学習を用いた技術が、ほとんどディープラーニングで代替可能となりました。

そのため、ディープラーニングが多くの業界の閾値となる線引を行い、これよりも良い結果を実証できた場合、そのアルゴリズムは非常に優れていると言いやすくなりました。

そういった点で、全ての例ではないですが、「とりあえずディープラーニング」は研究の世界では正解といえます。

ビジネスに応用する際に気をつけるべきポイント3点

それでは、ビジネスに応用する際には「とりあえずディープラーニング」は正解なのでしょうか。

結論から言うと、正解と不正解の間だと思います。

当たり前の話ですが、時には正解、時には不正解。

ディープラーニングは良くも悪くも、あまり現場のデータに関する知見がなくても使うことができます。

そのため、多少精度は荒くても、スピード重視で攻めていく場合は、研究と同様、スタンダードを定めるという意味で使ってみるのが良いと思います。

では、どのようなときに使用すると危険であるかを紹介します。

前処理が適切か

「とりあえずディープラーニング」というフレーズをよく使うように、持っているデータをすべてディープラーニングの学習に使うことを見かけます。

「多少データがお粗末でも、ディープラーニングが内部で関係性を見出して、うまくやってくれるだろう」

これがディープラーニングの危険なところ1点目です。

なんでもかんでもディープラーニングという気持ちにさせるのが実は危険だったりします。

まず、ディープラーニングをはじめとした機械学習を使用する場合、『データの前処理』と呼ばれる処理が必要となります。

画像の場合はノイズを除去したり、不要な部分を取り除いたり、足りない点は補完したりします。

また業界の知識も重要で、医療画像の処理の場合は、まず男女で分けて、年齢で分けてなど、ひとつのモデルではなく、「20代男性のみで1つのモデル」、「40代女性のみで1つのモデル」といったように、事前知識をもとに、データを大まかに分類しておくことが多いです。

まず、ディープラーニングを過信しすぎず、データの前処理をしっかりと行いましょう。

内部の構造がわかっていないか

そもそも事前知識として、内部の構造がある程度わかっている場合があります。

たとえば、ワインの質は、アッシェンフェルターのワイン方程式として、その年の降雨量や気温の重み付きの足し算として表現されることが知られています。

このような場合、わざわざ非線形のテクニカルなディープラーニングを使用するよりも、簡単な線形モデルで十分かつ高精度が期待されます。

サンプル数が十分にあるか

ディープラーニングにおける最も大きな問題は、モデルの内部に含まれるパラメータが非常に多いことです。

このパラメータの多さが非常に柔軟に対応できる万能さを生み出しているのですが、これは諸刃の剣です。

直感的にわかると思うのですが、内部の構造が複雑であればあるほど、たくさんのデータがないとチューニングがうまくできません。

そのため、Webのデータなど膨大な量を確保できる場合には有用なアプローチですが、数十〜数百個程度しかデータがない場合にはうまくチューニングすることができませんので注意が必要です。

もちろん入力変数の数にもより、このあたりは以下のスライドや「次元の呪い」と調べると解説されています。

まとめ

機械学習を導入する際に抑えておくべき3つのポイント

  • 前処理は適切か
  • 内部構造がわかっていないか
  • サンプル数が十分にあるか

この3点を意識すると、ディープラーニング以外にも適切なアルゴリズムを見つけられると思います。

なにかを解析する際に「とりあえずディープラーニングでいこう!」から、「データ量が十分だけど、内部構造がよくわかってないし、前処理はこれで大丈夫そうだから、とりあえずディープラーニングでいこう!」になると嬉しいです。

最後になりますが、それでもディープラーニングはやっぱりすごいです。

キカガク Online


キカガク Online では、機械学習入門向けの記事を配信します。
機械学習人工知能ディープラーニングを学びたい方向けの基礎講座の記事から、機械学習を使ったビジネス導入例まで幅広く取り扱います。

フォローお願いします!

twitter.com twitter.com

機械学習の初心者が『独学で失敗する理由』と挫折を回避するために『最初に読むべき参考書3選』


こちらは『キカガク Online』の記事を、はてなブログ向けに編集してお届けしています。

はじめに

機械学習の初心者は色々なポイントで挫折を経験します。

その中でも非常に多いのが「最初の参考書選び」による失敗です。

機械学習を独学する上で最初に選ぶ参考書は非常に重要であり、この最初の参考書が挫折するかどうかを左右すると言っても過言ではありません。

今回は、どのように失敗してしまうのか、そして、うまくいくために最初にどの参考書を読むべきか紹介します。

なぜ挫折するのか

よくありがちなミスとして、「機械学習 入門書」と検索して、ヒットした参考書を購入してしまうことです。

たとえば、このような本を購入されたことがある方はいらっしゃるのではないでしょうか。

パターン認識と機械学習 上パターン認識と機械学習 上
C.M. ビショップ 元田 浩

丸善出版 2012-04-05
売り上げランキング : 16807

Amazonで詳しく見る
by G-Tools

機械学習の入門書は、様々なアルゴリズムやその実装が本の中に沢山詰め込まれており、非常に便利なのですが、これはある程度の数学を抑えた人であるという前提があります。

もちろん、参考書の最初には導入として、「数学の基礎事項」などと書かれた章がありますが、これは問題の解き方を覚えるのと同じく、本質の理解ではなく手順を覚えるためのものです。

そのため、機械学習を勉強する方は、その基礎段階として、まず3つの分野を抑える必要があります。

それは、微分積分線形代数確率統計です。

この3つがあやふやな状態で始めると、いつかは挫折するか、手戻りが発生するため、最初に少し遠回りでも(結局は近道なのですが)、しっかりと勉強しておくことをおすすめします。

おすすめの参考書3選

今回は、この上記の3分野の基礎を押さえるために、筆者が一番良かったと感じている3冊を紹介します。

実は、3冊とも同じシリーズであり、少し怪しそうなタイトルであったため、長い間避けていたのですが、実際読んでみるとそのわかりやすさに、今ではほぼ全シリーズが手元にあります。

このシリーズの良い点

・読み手がまったくわからない前提で書いてある

・口語調のため、授業を聞いている感覚で読める

・先生がつまずきそうなポイントを先回りで教えてくれる

ぜひ、おすすめですので参考にしてみてください。

微分積分

機械学習にとって、微分積分は非常に重要です。

スバラシク実力がつくと評判の微分積分キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!スバラシク実力がつくと評判の微分積分キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!
馬場 敬之

マセマ 2016-08
売り上げランキング : 27361

Amazonで詳しく見る
by G-Tools

この本では、最初から最後までやるというよりは、極限や微分偏微分の部分を一旦抑えるだけで大丈夫です。

難しいかったりテクニカルな積分は、電磁気などの物理学を専攻しない限り合うことはありません。

線形代数

この一冊は秀逸といえます。

スバラシク実力がつくと評判の線形代数キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!スバラシク実力がつくと評判の線形代数キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!
馬場 敬之

マセマ 2015-12
売り上げランキング : 22324

Amazonで詳しく見る
by G-Tools

機械学習では固有値をよく使うため、本巻の最後まで一通り学ぶことをおすすめします。

早い人であれば、2〜3日で読み終えられる程度です。

確率統計

確率統計も機械学習では非常に重要です。

スバラシク実力がつくと評判の統計学キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!スバラシク実力がつくと評判の統計学キャンパス・ゼミ―大学の数学がこんなに分かる!単位なんて楽に取れる!
馬場 敬之 久池井 茂

マセマ 2010-05
売り上げランキング : 251939

Amazonで詳しく見る
by G-Tools

こちらは、微分積分と同じく、全て読み終えるというよりは、各種統計量の定義を抑えておき、必要になれば適宜確認する程度で大丈夫です。

まとめ

最初の参考書選びは非常に重要ですので、今回の記事により、機械学習初心者への導入の助けになると嬉しいです。

「基礎なくして応用なし」「急がば回れ

機械学習を学ぶ際には、これらの言葉の意味を痛感するので、ぜひ基礎力をしっかりとつけていきましょう。

キカガク Online

キカガク Online では、機械学習入門向けの記事を配信します。

機械学習人工知能ディープラーニングを学びたい方向けの基礎講座の記事から、機械学習を使ったビジネス導入例まで幅広く取り扱います。

キカガクOnlineの関連記事

機械学習の数学が初心者にも学びやすい3つの理由機械学習をこれから学ぶ人がPythonを使うべき3つの理由機械学習とは?ビジネスにおけるメリット

機械学習入門のための学習情報サイト『キカガク Online』を公開しました

機械学習入門のためのオンライン家庭教師『キカガク』をご存知でしょうか。

 

この『キカガク』で学習する前に、まず機械学習によるメリットや、数学やプログラミングの大枠を知っておきたいという要望がありました。

 

そこで、我々から提供できることとして、機械学習に興味を持ってもらえるためのメディアを作ろうということで完成したのがこちらです。

 

そして、ついにキカガクにtwitterの公式アカウントが誕生しました!

↑ ↑ ↑

こちらのアカウントで最新の記事をお知らせしているので、ぜひフォローお願いします!

 

 

「キカガクOnline」では、機械学習関連で読み手の方、特にビジネスパーソンに面白いと思ってもらえる記事を沢山書いております。

たとえば、こちらが現在の人気記事です。

 

 

ぜひ、ブックマークして、定期的に見に行ってもらえると、嬉しいです!

 

「こんな記事を書いて欲しい!」といった要望も随時受け付けておりますので、ぜひコメントください!

 

--------------------

↓ ↓ ↓ フォローお願いします ↓ ↓ ↓

 

起業した学生時代の友人と再会

昨日は学生時代の友人に会ってきました.

 

f:id:carat-yoshizaki:20161210161922j:plain

 

彼と知り合ったのは,約一年前。

京都大学で開催されたGTEP 海外起業研修というイベントであり、ふたりとも修士論文を控えた修士2回の大学院生でした。

 

彼は、研修直後から起業に向けてすぐに動き始め、友人のスタートアップに参加したりと積極的でした。

そんな友人にすごく影響を受けており、いつしか自分も起業をする!と決心していました。

 

 

そして、起業研修から約一年後。

 

起業したことを彼に報告すると、すぐに会おうと連絡をくれて、渋谷で再開しました。

彼も友人のスタートアップの手伝いを半年ほどして、今は株式会社Ristを設立し、代表取締役として活発に活動していました。

www.rist.co.jp

 

出会った頃は大学院生だったふたりが、次に再開する頃には起業家という非常に面白いケースだなと思います。

話す内容は学生時代の研究の話とは全く異なり、VCからの資金調達か自己資金か、優秀な人の雇い方、契約周りの失敗談などなど非常に楽しい2時間でした。

同じ境遇の友人がいてくれると、非常に心強いです。

 

友人の会社の株式会社Ristでは、機械学習の技術を応用して世の中の役に立てるためのサービス開発をしているので、興味のある方はぜひ問い合わせてみてください。

 

お互い頑張ろう!

 

www.caratinc.jp

 

kikagaku.net

【機械学習初心者向け】最初に抑えるべき30項目とオススメの参考書20選

Qiitaの技術ブログとして書きました。

qiita.com

 

最初に

 

どうやって勉強するか

  ↓

何を勉強するか

  ↓

どの参考書で勉強するか

 

これを決めることってすごく大事なんですよね。

 

今まで見てきた機械学習を勉強したい人あるあるが

「まず、有名だと聞いたパターン認識機械学習の上下巻セットで買いました!

 これから勉強します!」

https://images-na.ssl-images-amazon.com/images/I/41O0QFyTHJL._SX333_BO1,204,203,200_.jpg https://images-na.ssl-images-amazon.com/images/I/418MuoJetFL._SX327_BO1,204,203,200_.jpg

 

「 。 。 。 」

 

となってしまうんですよね。

 

パターン認識機械学習」は超良書で、私自身はかなりの時間をかけて原著の英語版まで読んだくらい素晴らしいのですが、初心者が手を出すべき一冊とは言えません。

 

どうせ挫折してしまうくらいなら、簡単で概念程度しか分からない薄っぺらい本の方がまだ良かったりします。

やっぱり勉強は大枠から埋めていきましょう。

 

そんな訳で、大枠から埋めていく効率的な勉強の仕方とオススメの参考書を書いたので、機械学習に興味をお持ちの方は、ぜひこちらの記事をご覧下さい。

qiita.com

 

 

それでもやはり独学が難しいと感じた際は、ぜひ弊社の機械学習のオンライン家庭教師『キカガク』へお申し込みください。

知識が豊富な専門家が徹底的にサポートいたしますので、機械学習のスキルが身につくこと間違いないです。

kikagaku.net

株式会社Carat 設立のご報告

本日、Naoki Matsumoto​と斎藤 陽介 (Yosuke Saito)​の3人で株式会社Caratを設立いたしました。

f:id:carat-yoshizaki:20161205235131j:plain

※ 写真は登記直後の法務局にて

 

弊社では『すべての人をより輝かせる』をビジョンとして、サービス展開していきます。
「その人にしかできないことに集中して欲しい」
そういった想いを弊社では、サービスを通じてお客様へ届けていきます。
メイン事業は、『人のノウハウを整理し、すべての人へ提供するエンジン』の開発を行います。

www.caratinc.jp

 

 

そして、弊社サービスの第一弾として、機械学習のオンライン家庭教師『キカガク』をリリースしました。

 

機械学習の個別授業を全国のどこでもお好きな時間にオンライン受講できます。
機械学習は企業の現場にも応用の利く非常に有用なスキルです。
しかし、数学やプログラミングの幅広い知識が必要であるため習得への障壁が高く、参考書は買ったけれど挫折してしまったとの声が後を絶ちません。
実は、レベルが高くて手が出せない訳ではなく、勉強法がわからないことや、ちょっとした疑問が積もることが、挫折の大きな原因だったりします。
そこで、効率的に勉強できるカリキュラムと、ちょっとした質問を気軽に聞けるオンライン家庭教師により、受講者の理解をしっかりサポートします。
『キカガク』から輩出された人達が、多くのプロダクトをより輝かせてくれることを願っています。
機械学習に興味をお持ちの方は、ぜひお気軽にお問い合わせください。

kikagaku.net

 

一緒に起業してくれる2人はもちろんのこと、たくさんな方の支援があり、ここまで来ることができました。
これからは事業を大きくすることが最大の恩返しですので、精一杯頑張ります。

 

応援よろしくお願いします!

 

株式会社Carat 取締役 兼 最高執行責任者
吉崎 亮介

 

P.S.
事業で欲しい物をAmazonウィッシュリストにしました。
こちらからご支援頂けると、吉崎が泣いて喜ぶので、ぜひともよろしくお願いします!