にほんごのれんしゅう

日本語として伝えるための訓練を兼ねたテクログ

2018-07-01から1ヶ月間の記事一覧

テーブルデータに対して、DenosingAutoEncoderで精度向上

データセットの問題 Kaggle Porto Seguroでは問題となっている点があって、テストデータとトレインデータのサイズの方が大きく、トレインだけに着目してしまうと、LeaderBoardにoverfitしてしまう問題があります。 これはトレインだけで学習するために起こる…

BigQueryでUDFとwindow関数を使う 

bigqueryでUDFとwindow関数を使う 転職してからMapReduceそのもののサービスや改良したサービスであるCloud DataFlowなどのサービスより、初手BigQueryが用いられることが増えてきました。分析環境でのプラットフォームを何にするかの文化の違いでしょう。 B…