機械学習

BERT 日本語モデルの実験

概要 BERT (arxiv, GitHub) を理解するための第一歩として、訓練済み日本語モデルを fine-tune して文章のトピック分類の実験をしました。 この記事に含まれない内容: BERT の説明 この記事に含まれる内容: 訓練済み BERT 日本語モデルのまとめ 環境構築や…

にじさんじの Twitter フォロワー分析

概要 にじさんじに所属する全ライバーの Twitter フォロワー情報を取得し、 にじさんじ全体の(重複を除く)フォロワー数 1人のファンがフォローするライバー数の分布 フォロワーの重複度合いを基に(t-SNE で)図示したライバーの位置関係 を分析しました。…

つくってまなぼう 自動微分 (Automatic Differentiation)

導入 ADの中心的なアイデア 微分の連鎖律 動的計画法 評価順序 Forward-mode (bottom-up) AD Reverse-mode (top-down) AD つづく 参考文献 導入 機械学習で予測問題(Regression や Classification)を解くステップは、大きく以下のように分解することができ…

LAPRAS株式会社でインターンを始めました

概要 LAPRASを選んだ理由 広報記事の内容に説得力が有る 組織体制がおもしろい インターン選考 現在までにやった仕事 取り組んだ課題 仕事の方法論 LAPRASにインターンとして入った後の印象 オープンであれ エンドユーザーファースト 最後に 概要 2019年3月2…

Google Place APIで住所や地名のデータを構造化する

概要 Google Mapの検索機能は、人がある程度大雑把に地名を入力しても正確な住所を返してくれます。これを利用すれば、人が生成した住所や地名の膨大なデータを、プログラムや機械学習で扱いやすいように構造化することができます。この記事では特に、 Tokyo…