にほんごのれんしゅう

日本語として伝えるための訓練を兼ねたテクログ

GANによるノイズ・モザイク等の除去

GANによるノイズ・モザイク等の除去 近況 眠い。 実は今月、三回も停電が起きてそのたびに機械学習のモデルが飛んでいます。原因は電子レンジとケトルを両方利用したとか、そういった当たり前のことなのですが...(ブレーカを飛ばしているの私でないです)。 …

ベイズ最適化と、しりとり

モチベーション 機械学習ばかりやらずに、久々にプログラミングをしたくなったというか、下手の横好きというか、プログラムを書いてみたくなりました。自分で思った通りにロジックを組めるのは楽しいものです。 YouTubeを見ることを趣味の一つにしているので…

Pix2pix with Text

Pix2Pixとは 01/06/2017. この記事の生成物に関して、修正点があるのであとで修正します 自動生成系の深層学習の一つ 2つの画像の差を学習して、その差を補う形で画像などを出力する 図1. facadeとよばれるデータで学習した場合 図2. GANのモデルの様子。生…

チャットボットをディープラーニングで作成

チャットボットをディープラーニングで作成 アマゾンプライムビデオを見ていたら、涼宮ハルヒの憂鬱が公開されており、懐かしい気持ちで見ていました。私がアニメとSFにハマるきっかけとなった思い出の作品です。 この作品をみてSFを調べだし、汎用AIに興味…

複数の著者をテキスト情報を混ぜ合わせたRNNと長文の改善手法

問題背景 RNNによる単純な小説の学習と、学習結果の出力は過去、多くの事前研究で行われており、ある程度、人が書いたらしいと思われる文章が数多く出力されてきた。[1], [2] しかしながら、複数の著者の小説を混在させて評価した例は少ないか無いように思う…

レビューのスコア予想問題

背景 商品やサービスを論じるときに、その文脈から定量的にどの程度良かったのか、悪かったのか知ることは難しい 幸いなことにネットには膨大な商品とサービスのレビュー件数が存在し、サービスごとのドメインが異なってもある程度、定量的に文章から良し悪…

■ 機械学習で絵文字の意味を知る

■ 機械学習で絵文字の意味を知る 絵文字は近年になってiPhone, Androidに搭載されてSMSやTwitterなどで積極的にソーシャルメディアに現れるようになった文字です。 文字自体の成立が比較的新しいということもあり、広辞苑などに詳しい意味が定義されているわ…

ディーブラーニングのDCGANを用いたmangaキャラクタの作成

ディーブラーニングのDCGANを用いたmangaキャラクタの作成 生成したなんかアンニュイなキャラ 人間のみの権利と思われていた創造と創生の技術がついにマシーンが行えるようになりました。去年の今頃にDCGANという手法で画像を人間が、ぱっと見ただけではわか…

Doc2vecを利用したレコメンデーションシステム

Doc2vecを利用したレコメンデーションシステム(は、諦めて盗用チェックツールとかのほうがいいかも) Embeddingという文字、文字列をベクトル化する技術が機械学習、Deep Learning界隈で用いられているように見えます CNNよるセンチメント分析や、Word2Vec…

Seq2Seqで小説自動生成の学習を失敗した話

Seq2Seqで小説自動生成の学習を失敗した話 失敗した経験をネット上に上げることにいくつか意見があるでしょうが、機械学習を行って、学習が失敗すると、大きな時間的な損失になるよという見地を示す目的があります。 小説の自動生成では、ディープラーニング…

CNNを利用したセンチメント分析

■ CNNを利用したセンチメント分析 Deep Learningを利用したテキスト解析が去年の12月ごろから盛んです。ネットの日本語のQIITAやはてなブックマークを見ていると、流行したのが去年から今年の頭あたりでインパクトの強い文献は出尽くしているように見えま…

文章自動作成; char-rnnとその改良

■ 文章自動作成; char-rnnを試しました、とその改良 そろそろ就職しないと飢えて死にそうです 文章の自動錬成という物書きにとっては錬金術に等しい術があるらしいということを知ったので、試してみたいと思いました char-rnnをいじっていて気付いたのですが…

Deep Leaningを使った検索エンジン

■ Deep Leaningを使った検索エンジン - 無職になり数ヶ月が過ぎました。 - 働くということに関していろいろ疑問に思っています。 ■モチベーション: 時間に余裕ができたので、キンドル書籍のランキング・検索サイトをずっとコーディングしていました。検索機…

Raspberrypiのnginxのreverse proxyにhost名が継承されなかったので対応策

PHPのフレームワークなどを使っていると、$_SERVER['HTTP_HOST']でホスト名を決定したりしてnginxの配下のリバースプロキシではうまく動作しなかったりする。単純に指定のIPに飛ばすには以下のような設定をすればよい server { listen 80; server_name eisei…

【書評】天冥の標IX PART1──ヒトであるヒトとないヒトと

あれこれ3年ぐらいずっと読んできたシリーズの第9章。いよいよメニーメニーシープの世界がどんな状況に放り込まれているのかわかってきた。 倫理兵器の存在目的がロイズ保険会社の顧客を十分に獲得するための正しい恋愛感情の流布なのだということで、なん…

【書評】「犬と魔法のファンタジー」が胃が痛くなるほど就活事情をよく表している件

表題の通りの通りの書評です。 主人公は冒険部に所属する大学生。ただし時代背景は現自在ではなくて、剣と魔法が存在する世界のことである。そんな中、主人公はお祈りと呼ばれる企業面接の失敗を何度も何度も繰り返す。その中で40代のOBや、いわゆるオタサ…

焼きなまし法(Simulated Annealing)のJava8による再実装

課題 焼きなまし法(SA)と呼ばれるかなりレガシーなアルゴリズムにはだいぶ世話になったのでJavaでも使ってみたかった。(Pythonではよく使っていた) Javaでの実装を探していたが、見つからないので、PythonのコードをJava8で再実装した。(目的関数の設定にラ…

ビンゴゲームのプログラム作成

ビンゴゲームプログラムをPythonというプログラミング言語で作成しました。 このプログラムでは指定した範囲内部の数値をランダムに表示することが可能で、tmpファイルを作成して、その中に過去の表示した数値を保存することで出てくる値の重複を防ぎます。 …

東京タラレバ娘の破壊力の高さ

しろくま先生の本レビューを見て興味を持ったので読んだ。 p-shirokuma.hatenadiary.com 結論から言うと人によってはメンタルに支障をきたすほどの破壊力を秘めている。私もこれはHPを大幅に持って行かれた本になる。 しろくま先生ほど詳細な分析はできない…

ニルヤの島を読んで

ニルヤの島とは 2014年度の「ハヤカワSFプロジェクト」の大賞に輝いた作品である。なお、審査員は小島秀雄と神林、東とワタシ好みの審査員なのでどのような物語なのだろうとワクワクしながらキンドルでポチッと購入した。 # ミームに基づくあらゆる事象 …

Project Itohの「屍者の帝国」

表題の映画を見てきました。熱と認識の不整合が取れているうちに感想を書いてしまいます。ネタバレ注意です。 屍者 → 一度物理的に死んで、ネクロウェアというソフトウェアを脳に書き込んだ人間。ハーモニーのような哲学的ゾンビとは異なる、単純な「意思を…

シェアオフィスに関して

いいオフィスに行ってきました LIGさんが経営する上野のいいオフィスに行ってまいりました。 行こうと思ったきっかけ。 もともと家でプログラミングやハッキングをするのはどうしてもだらけてしまい、客観的な目がないとだめだなーと常に思っていました 一人…

Elastic-Netをロジスティック回帰の代わりに使いたい

次元圧縮という視点においてElasticNetは有用である。 それは、min[1/2NΣ(y_i - β_0 - x_iβ)^2 + λPα(β) ]というElasticNetの方程式において、Pαのパラメータを調整することで次元圧縮が可能なことに起因している Pα(β) = (1 - α)1/2||β||^2 + α||β||という…

Galaxy Note Edge Lolipopのroot化

はじめに root化等ハックについて、HTCが開発者登録をすれば簡単に行えることから、今までそんなにroot化の価値を感じていませんでした。 だがしかし、docomoのGalaxy Note Edgeを買ったところ、邪魔なアプリが多い、羊がうざい、フォントがtakaoじゃないな…

Chrome拡張機能を作るのが楽しい

最近、コードを書いていませんでしたが、Chrome拡張機能、作るの楽しいです。 何と言ってもJavaScriptオンリーで書ける手軽さと、普段使っているインターネットのコンテンツを自由自在にハックできるというのがいいです。 ブラウザに足らない機能があれば自…

みんなのRを読んだ

みんなのRを読んだ Rを身につけなければいけないね 流行りのRを身につけないと将来食っていけなくなるのではないのか、みたいな漫然とした不安感があった。 Rはデータを解析する上で非常に便利なソフトウェアである。Pythonのtheanoを用いたとしても、ワンラ…

日光地区の各歴史の特徴量抽出について

日光地区の各歴史の特徴量抽出について 日光地区の各歴史は、日光東照宮など世界遺産に登録された文化財などがあることより、可能な限り日光市町村の努力により発信しようと試みている。 日本における市町村として3番目に大きいということもあり、東照宮以外…

古くて使い道のないスマートフォンをGITサーバにする

# 古くて使い道のないスマートフォンをGITサーバにする 皆さん、古く型遅れでどうにもならないスマートフォンをどうしていますか? よく聞く意見では、音楽プレイヤーにする、お風呂での読書専用機にする、格安シムを入れて二台並列運用するとかね。 私の使…

アクチュアリー試験を受けることにした(モデリングから時系列解析解析まで)

アクチュアリー試験を受けることにした(モデリングから時系列解析解析まで) 前提:田舎では、おおよそ全ての知的創造産業が機能し無い 証明:IT産業の分布より把握 前提:知的ではないがなんらかの知的に近い有資格が有効 証明:東京と見劣りするわけでない…

Python Theanoでのロジスティック回帰が簡単

Python Theanoでのロジスティック回帰が簡単 モチベーション 今までC++でlbfgsbを実装するなど、速度重視、大容量処理を目指していた C++の実装コストは高い。 Rではない、スクリプト言語による実装を探していた Python Theanoというのがいい感じ ロジスティ…