Markovify + Mecabによるマルコフ連鎖を使った文章生成

Python勉強開始から2月と20日が経過。 空白期間を簡単にまとめる Raspberry pi 3 Model B を購入。 Rasbian をインストールし Linux 系 OS を弄り回す。 Raspberry pi とメインの Windows マシンを SSH 接続(MobaXtermを使用)。 Flask , Bottle とngrokの…

体調を崩す

ようやく体調が戻ったので勉強を再開すると言い訳をしておく。 体調不良を押して書きたかったこと 日本の警察がプログラム、ネットワーク技術について無知であるほど不正指令電磁的記録罪に問われる犯罪者数は増加する。 高い検挙率、犯罪検挙数は、警察が優…

引き続き、テキストを使った Python 勉強中

Python勉強開始からほぼ一ヶ月が経過。 前回に引き続き、『いちばんやさしいPythonの教本』を 進める第8章を終えて、残すは9章のみだが、webアプリケーションの章なのでスキップする。 10日間にやったこと Wikiextractor で下処理したデータから a タグでリ…

必要なWikipediaの項目から本文を抽出する

Python勉強開始から20日が経過。 『みんなのPython』を必要な箇所をひとまず終えたので、Wikipediaのデータ加工に取り組む。 手順 テキストデータが膨大なので、”doc id”(Wikipediaの項目ごとに与えられるID)と”タイトル”だけを抽出したインデックスを作る…

学習元データとなるWikipediaデータの下処理(ファイル操作と記事タイトル抽出)

Python勉強スタートから約10日が経過。 『みんなのPython』をもとに基礎学習と並行して、Wikipediaのダンプデータの下処理に挑戦。 ダウンロードしたダンプデータはすでにwikiextractorを利用して最低限の整形が行われている。テキストファイルで2ギガほどあ…

Python勉強中(ほぼ一週間経過)

Pythonの勉強を始めた。 Pythonでやりたいこと 機械学習で文章の自動生成(自分が書いた物を学習、生成したものを手直ししてさらに学習させるとか) Ren'pyでノベルゲームを作る(日本語ではあまり情報がなさそう) 集めた資料の編集や出力を自動化、あるい…