今日はオープンソースな日本語の自然言語処理ライブラリ「GiNZA」をインストールしていきます。
GiNZAのページはこちら。
https://megagonlabs.github.io/ginza/
GiNZA はPythonで動くのまずPythonをインストールしていきます。
以下のページから pythonをダウンロード
https://www.python.org/downloads/windows/

今回インストールするのはPython3.8.10 で上記の「Windows installer (64-bit)」というやつです。
最新はpython3.9.6なのですが、やってみるとGiNZAのインストールでエラーが起こったので、今回はPython 3.8.10をしていきます。
一応エラーを調べると以下ページがあったので、python3.9でもしかしたらできないのかもしれない。
ダウンロードしたらインストールしていきます。

- Add Python 3.x to PATH をチェック。※忘れずにやっておく
- Install now をクリック

完了です。
powershellを起動して実行できるか確認します。

PowerShell で python と入力してバージョンらしきものがでてくればOK。※念のためこれ以降管理権限で実行しています。
python --version
または
py -V
まずはPipをアップデートします。
pip install -U pip
PowerShellでスクリプトの実行を許可ってのがどこかに書いてあったので一応やっておく。
Set-ExecutionPolicy RemoteSigned -Scope CurrentUser -Force
GiNZA をインストール
pip install -U ginza
以下のエラーがでた(;^_^A
Running setup.py install for dartsclone ... error
ERROR: Command errored out with exit status 1:
・・・略
Running setup.py install for dartsclone ~なんちゃらかんちゃらとあり、よく見るとエラーメッセージの中に以下のリンクが張貼ってあった。
https://visualstudio.microsoft.com/ja/visual-cpp-build-tools/
ビルド用のツールが必要らしいので、このURLから ビルドtoolsをダウンロードしてインストールしていきます。

C++によるデスクトップ開発を選んでインストール。

その後、pip install -U ginza を実行するとできた!
ginzaと入力した後に文章を入力するとうまいことできました!

日本語の解析は難しそうですが結構うまいこと構文解析してくれますね。
今でもいろんなアプリで自然言語処理がつかれていますし、今後が楽しみです。自然言語処理はほとんどわかりませんが、ちょっとづつ学習していこうかなと思います。
では、お疲れさまでした!