にほんごのれんしゅう

日本語として伝えるための訓練を兼ねたテクログ

教師なしRNNによる連続した不完全情報(主にテキスト)の補完

教師なしRNNによる連続した不完全情報(主にテキスト)の補完 背景 Google(や、過去の私のブログの投稿)などで低解像度の映像を高解像度化する方法は、GANを使うことでわりとうまくいきました。 テキストにも同じような問題が適応できるのかって思うことが…

艦これのセリフ分類をCNNでやる

(2017/2/24追記. いろいろ試したんですが、objective functionをcategorial cross entropyからpoissonに変更し, softmaxの出力をlogを取ることで、急峻なスパイクを抑えることができある程度改善しました ) 艦これのセリフ分類をCNNでやる 幾つかの基礎と…

YoRHa No.2 Type Bを作りたかった

はじめに ドーモ。国家深層学習術師デス。(多数のミームが重なり合い、汚染が観測できるはずです) この前、Domain Transfer Network(DTN)というものがFacebookの機械学習関連の研究所から発表され、直接的な対応関係がなくても、対応したドメインに変化さ…

ウィキペディア日本語版 tf-idfのidf辞書の公開

nora(野良)-idf-dic モチベーション LevelDB(kvs)を利用した省メモリ設計で、すべてのWikipediaのコンテンツコンテンツを取得して処理したい XGBoostやElasticNetなど他のアルゴリズムでの前処理にを楽にしたい JSONスキーマなので、Python以外の他のスクリ…

StackGANによるフォントの錬金術

StackGANによるフォントの錬金術 図1. 中央が錬金したフォント 近況 図2. 真理の一撃を放とうとするカリオストロさん(公式絵より) グランブルーファンタジーというスマホのゲームでカリオストロというキャラクターがいます。もとは天才錬金術師で、自己の…

RNNのアンサンブルによる音楽の新規創出

近況 Qiitaに投稿しない理由なのですが、自分はQiitaを技術ナレッジのレポジトリのような使い方を想定してしていて、実際、多くの方が素晴らしい技術的なプラクティスを提供なさっています。 古い言葉でチラシの裏という表現がありますが、今回の私のは、ブ…

GANによるノイズ・モザイク等の除去

GANによるノイズ・モザイク等の除去 近況 眠い。 実は今月、三回も停電が起きてそのたびに機械学習のモデルが飛んでいます。原因は電子レンジとケトルを両方利用したとか、そういった当たり前のことなのですが...(ブレーカを飛ばしているの私でないです)。 …

ベイズ最適化と、しりとり

モチベーション 機械学習ばかりやらずに、久々にプログラミングをしたくなったというか、下手の横好きというか、プログラムを書いてみたくなりました。自分で思った通りにロジックを組めるのは楽しいものです。 YouTubeを見ることを趣味の一つにしているので…

Pix2pix with Text

Pix2Pixとは 01/06/2017. この記事の生成物に関して、修正点があるのであとで修正します 自動生成系の深層学習の一つ 2つの画像の差を学習して、その差を補う形で画像などを出力する 図1. facadeとよばれるデータで学習した場合 図2. GANのモデルの様子。生…

チャットボットをディープラーニングで作成

チャットボットをディープラーニングで作成 アマゾンプライムビデオを見ていたら、涼宮ハルヒの憂鬱が公開されており、懐かしい気持ちで見ていました。私がアニメとSFにハマるきっかけとなった思い出の作品です。 この作品をみてSFを調べだし、汎用AIに興味…

複数の著者をテキスト情報を混ぜ合わせたRNNと長文の改善手法

問題背景 RNNによる単純な小説の学習と、学習結果の出力は過去、多くの事前研究で行われており、ある程度、人が書いたらしいと思われる文章が数多く出力されてきた。[1], [2] しかしながら、複数の著者の小説を混在させて評価した例は少ないか無いように思う…

レビューのスコア予想問題

背景 商品やサービスを論じるときに、その文脈から定量的にどの程度良かったのか、悪かったのか知ることは難しい 幸いなことにネットには膨大な商品とサービスのレビュー件数が存在し、サービスごとのドメインが異なってもある程度、定量的に文章から良し悪…

■ 機械学習で絵文字の意味を知る

■ 機械学習で絵文字の意味を知る 絵文字は近年になってiPhone, Androidに搭載されてSMSやTwitterなどで積極的にソーシャルメディアに現れるようになった文字です。 文字自体の成立が比較的新しいということもあり、広辞苑などに詳しい意味が定義されているわ…

ディーブラーニングのDCGANを用いたmangaキャラクタの作成

ディーブラーニングのDCGANを用いたmangaキャラクタの作成 生成したなんかアンニュイなキャラ 人間のみの権利と思われていた創造と創生の技術がついにマシーンが行えるようになりました。去年の今頃にDCGANという手法で画像を人間が、ぱっと見ただけではわか…

Doc2vecを利用したレコメンデーションシステム

Doc2vecを利用したレコメンデーションシステム(は、諦めて盗用チェックツールとかのほうがいいかも) Embeddingという文字、文字列をベクトル化する技術が機械学習、Deep Learning界隈で用いられているように見えます CNNよるセンチメント分析や、Word2Vec…

Seq2Seqで小説自動生成の学習を失敗した話

Seq2Seqで小説自動生成の学習を失敗した話 失敗した経験をネット上に上げることにいくつか意見があるでしょうが、機械学習を行って、学習が失敗すると、大きな時間的な損失になるよという見地を示す目的があります。 小説の自動生成では、ディープラーニング…

CNNを利用したセンチメント分析

■ CNNを利用したセンチメント分析 Deep Learningを利用したテキスト解析が去年の12月ごろから盛んです。ネットの日本語のQIITAやはてなブックマークを見ていると、流行したのが去年から今年の頭あたりでインパクトの強い文献は出尽くしているように見えま…

文章自動作成; char-rnnとその改良

■ 文章自動作成; char-rnnを試しました、とその改良 そろそろ就職しないと飢えて死にそうです 文章の自動錬成という物書きにとっては錬金術に等しい術があるらしいということを知ったので、試してみたいと思いました char-rnnをいじっていて気付いたのですが…

Deep Leaningを使った検索エンジン

■ Deep Leaningを使った検索エンジン - 無職になり数ヶ月が過ぎました。 - 働くということに関していろいろ疑問に思っています。 ■モチベーション: 時間に余裕ができたので、キンドル書籍のランキング・検索サイトをずっとコーディングしていました。検索機…

Raspberrypiのnginxのreverse proxyにhost名が継承されなかったので対応策

PHPのフレームワークなどを使っていると、$_SERVER['HTTP_HOST']でホスト名を決定したりしてnginxの配下のリバースプロキシではうまく動作しなかったりする。単純に指定のIPに飛ばすには以下のような設定をすればよい server { listen 80; server_name eisei…

【書評】天冥の標IX PART1──ヒトであるヒトとないヒトと

あれこれ3年ぐらいずっと読んできたシリーズの第9章。いよいよメニーメニーシープの世界がどんな状況に放り込まれているのかわかってきた。 倫理兵器の存在目的がロイズ保険会社の顧客を十分に獲得するための正しい恋愛感情の流布なのだということで、なん…

【書評】「犬と魔法のファンタジー」が胃が痛くなるほど就活事情をよく表している件

表題の通りの通りの書評です。 主人公は冒険部に所属する大学生。ただし時代背景は現自在ではなくて、剣と魔法が存在する世界のことである。そんな中、主人公はお祈りと呼ばれる企業面接の失敗を何度も何度も繰り返す。その中で40代のOBや、いわゆるオタサ…

焼きなまし法(Simulated Annealing)のJava8による再実装

課題 焼きなまし法(SA)と呼ばれるかなりレガシーなアルゴリズムにはだいぶ世話になったのでJavaでも使ってみたかった。(Pythonではよく使っていた) Javaでの実装を探していたが、見つからないので、PythonのコードをJava8で再実装した。(目的関数の設定にラ…

ビンゴゲームのプログラム作成

ビンゴゲームプログラムをPythonというプログラミング言語で作成しました。 このプログラムでは指定した範囲内部の数値をランダムに表示することが可能で、tmpファイルを作成して、その中に過去の表示した数値を保存することで出てくる値の重複を防ぎます。 …

東京タラレバ娘の破壊力の高さ

しろくま先生の本レビューを見て興味を持ったので読んだ。 p-shirokuma.hatenadiary.com 結論から言うと人によってはメンタルに支障をきたすほどの破壊力を秘めている。私もこれはHPを大幅に持って行かれた本になる。 しろくま先生ほど詳細な分析はできない…

ニルヤの島を読んで

ニルヤの島とは 2014年度の「ハヤカワSFプロジェクト」の大賞に輝いた作品である。なお、審査員は小島秀雄と神林、東とワタシ好みの審査員なのでどのような物語なのだろうとワクワクしながらキンドルでポチッと購入した。 # ミームに基づくあらゆる事象 …

Project Itohの「屍者の帝国」

表題の映画を見てきました。熱と認識の不整合が取れているうちに感想を書いてしまいます。ネタバレ注意です。 屍者 → 一度物理的に死んで、ネクロウェアというソフトウェアを脳に書き込んだ人間。ハーモニーのような哲学的ゾンビとは異なる、単純な「意思を…

シェアオフィスに関して

いいオフィスに行ってきました LIGさんが経営する上野のいいオフィスに行ってまいりました。 行こうと思ったきっかけ。 もともと家でプログラミングやハッキングをするのはどうしてもだらけてしまい、客観的な目がないとだめだなーと常に思っていました 一人…

Elastic-Netをロジスティック回帰の代わりに使いたい

次元圧縮という視点においてElasticNetは有用である。 それは、min[1/2NΣ(y_i - β_0 - x_iβ)^2 + λPα(β) ]というElasticNetの方程式において、Pαのパラメータを調整することで次元圧縮が可能なことに起因している Pα(β) = (1 - α)1/2||β||^2 + α||β||という…

Galaxy Note Edge Lolipopのroot化

はじめに root化等ハックについて、HTCが開発者登録をすれば簡単に行えることから、今までそんなにroot化の価値を感じていませんでした。 だがしかし、docomoのGalaxy Note Edgeを買ったところ、邪魔なアプリが多い、羊がうざい、フォントがtakaoじゃないな…