TensorFlow テキストの概要

TensorFlow Text は、TensorFlow 2.0 ですぐに使用できるテキスト関連のクラスと操作のコレクションを提供します。このライブラリは、テキストベースのモデルで定期的に必要とされる前処理を実行でき、コア TensorFlow では提供されないシーケンス モデリングに役立つその他の機能が含まれています。

テキストの前処理でこれらの操作を使用する利点は、それらが TensorFlow グラフで実行されることです。トレーニング時のトークン化が推論時のトークン化とは異なることや、前処理スクリプトの管理について心配する必要はありません。

TensorFlow テキストのインストール

pipを使用してインストールする

pip install を使用して TF Text をインストールする場合は、TF Text の対応するバージョンを指定する必要があるため、実行している TensorFlow のバージョンに注意してください。

pip install -U tensorflow-text==<version>

ソースからビルドする

TensorFlow Text は TensorFlow と同じ環境で構築する必要があります。したがって、TF Text を手動でビルドする場合は、TensorFlow もビルドすることを強くお勧めします。

MacOS 上でビルドする場合は、coreutils をインストールする必要があります。おそらくHomebrewを使用するのが最も簡単です。まず、ソースからTensorFlow をビルドします。

TF Text リポジトリのクローンを作成します。

git clone  https://github.com/tensorflow/text.git

最後に、ビルド スクリプトを実行して pip パッケージを作成します。

./oss_scripts/run_build.sh