2019-01-01から1ヶ月間の記事一覧

学習元データとなるWikipediaデータの下処理(ファイル操作と記事タイトル抽出)

Python勉強スタートから約10日が経過。 『みんなのPython』をもとに基礎学習と並行して、Wikipediaのダンプデータの下処理に挑戦。 ダウンロードしたダンプデータはすでにwikiextractorを利用して最低限の整形が行われている。テキストファイルで2ギガほどあ…

Python勉強中(ほぼ一週間経過)

Pythonの勉強を始めた。 Pythonでやりたいこと 機械学習で文章の自動生成(自分が書いた物を学習、生成したものを手直ししてさらに学習させるとか) Ren'pyでノベルゲームを作る(日本語ではあまり情報がなさそう) 集めた資料の編集や出力を自動化、あるい…