注
この Databricks Runtime バージョンのサポートは終了しました。 サポート終了日については、サポート 終了と有効期限の履歴を参照してください。 サポートされている Databricks Runtime のすべてのバージョンについては、「Databricks Runtime リリース ノートのバージョンと互換性」を参照してください。
databricks Runtime 11.0 for Machine Learning は、Databricks Runtime 11.0 (EoS) に基づいて、machine learningとデータ サイエンスに対応したto-go 環境を提供します。 Databricks Runtime ML には、TensorFlow、PyTorch、XGBoost など、多くの一般的な機械学習ライブラリが含まれています。 Databricks Runtime ML には、機械学習パイプラインを自動的にトレーニングするツールである AutoML が含まれています。 また、Databricks Runtime ML では、Horovod を使用した分散型ディープ ラーニング トレーニングもサポートされます。
Databricks Runtime ML クラスターを作成する手順などの詳細については、「Databricks での AI と機械学習」を参照してください。
新機能と機能強化
Databricks Runtime 11.0 ML は Databricks Runtime 11.0 上に構築されています。 Apache Spark MLlib や SparkR など、Databricks Runtime 11.0 の新機能については、 Databricks Runtime 11.0 (EoS) のリリース ノートを参照してください。
AutoML の機能強化
AutoML では、大規模なデータセットのパフォーマンスを向上させるために、サンプリングの比率を高くできるようになりました。 詳細については、「大規模なデータセットのサンプリング」を参照してください。
システム環境
Databricks Runtime 11.0 ML のシステム環境は、Databricks Runtime 11.0 とは次のように異なります。
-
DBUtils: Databricks Runtime ML には、ライブラリ ユーティリティ (dbutils.library) (レガシ) は含まれません。
代わりに
%pipコマンドを使用してください。 「NotebookスコープのPythonライブラリ」を参照。 - GPU クラスターの場合、Databricks Runtime ML には次の NVIDIA GPU ライブラリが含まれています。
- CUDA 11.3
- cuDNN 8.0.5.39
- NCCL 2.9.9
- TensorRT 7.2.2
ライブラリ
以降のセクションでは、Databricks Runtime 11.0 ML に含まれているうちで、Databricks Runtime 11.0 に含まれているものとは異なるライブラリ一覧を示します。
このセクションの内容は次のとおりです。
最上位層ライブラリ
Databricks Runtime 11.0 ML には、次の最上位層ライブラリが含まれています。
- GraphFrames
- Horovod と HorovodRunner
- MLflow
- PyTorch
- spark-tensorflow-connector
- TensorFlow
- TensorBoard
Python ライブラリ
Databricks Runtime 11.0 ML では、Python パッケージ管理に Virtualenv が使用され、多くの一般的な ML パッケージが含まれています。
Databricks Runtime 11.0 ML には、以降のセクションで指定されているパッケージに加えて次のパッケージも含まれています。
- hyperopt 0.2.7.db1
- sparkdl 2.2.0-db6
- feature_store 0.4.1
- automl 1.10
CPUクラスター上のPythonライブラリ
| 図書館 | バージョン | 図書館 | バージョン | 図書館 | バージョン |
|---|---|---|---|---|---|
| absl-py | 1.0.0 | Antergos Linux | 2015年10月 (ISO-Rolling) | argon2-cffi | 20.1.0 |
| アスター | 0.8.1 | astunparse | 1.6.3 | async-generator (非同期ジェネレーター) | 1.10 |
| 属性 | 21.2.0 | バックコール (再発信機能) | 0.2.0 | バックポート.entry-points-selectable | 1.1.1 |
| bcrypt | 3.2.2 | 漂白剤 | 4.0.0 | ブリス | 0.7.7 |
| boto3 | 1.21.18 | botocore | 1.24.18 | キャッシュツールズ (cachetools) | 5.1.0 |
| カタログ | 2.0.7 | サーティフィ | 2021.10.8 | cffi (CコードをPythonで呼び出すためのライブラリ) | 1.14.6 |
| チャーデット | 4.0.0 | charset-normalizer (文字コード正規化ツール) | 2.0.4 | click | 8.0.3 |
| クラウドピックル | 2.0.0 | cmdstanpy | 0.9.68 | configparser (コンフィグパーサー) | 5.2.0 |
| 日付変換 | 2.4.0 | 暗号 | 3.4.8 | サイクリスト | 0.10.0 |
| サイメム | 2.0.6 | Cython | 0.29.24 | databricks-automl-runtime(データブリックス・オートエムエル・ランタイム) | 0.2.8 |
| databricks-cli | 0.16.4 | dbl-tempo | 0.1.12 | dbus-python | 1.2.16 |
| debugpy | 1.4.1 | デコレータ | 5.1.0 | デフューズドXML (defusedxml) | 0.7.1 |
| ディル | 0.3.4 | ディスクキャッシュ | 5.4.0 | distlib | 0.3.4 |
| ディストリビューション情報 | 0.23ubuntu1 | 入口点 | 0.3 | エフェム | 4.1.3 |
| ファセット概要 | 1.0.0 | fasttext(ファーストテキスト) | 0.9.2 | ファイルロック | 3.3.1 |
| Flask | 1.1.2 | フラットバッファーズ | 2.0 | fsspec | 2021年8月1日 |
| 未来 | 0.18.2 | ガスト | 0.5.3 | ギットディービー | 4.0.9 |
| GitPython | 3.1.27 | google-auth(Google認証) | 2.6.0 | google-auth-oauthlib | 0.4.6 |
| グーグルパスタ | 0.2.0 | grpcio | 1.44.0 | ガニーコーン (gunicorn) | 20.1.0 |
| gviz-api | 1.10.0 | h5py | 3.3.0 | ヒジュリ変換器 | 2.2.3 |
| holidays | 0.13 | ホロヴォド | 0.24.3 | HTML最小化ツール(htmlmin) | 0.1.12 |
| huggingface-hub(ハギングフェイスのハブ) | 0.6.0 | idna | 3.2 | イメージハッシュ (ImageHash) | 4.2.1 |
| imbalanced-learn(不均衡データに対応するための機械学習ライブラリ) | 0.8.1 | importlib-metadata | 4.8.1 | ipykernel | 6.12.1 |
| ipython | 7.32.0 | ipython-genutils (IPython用のユーティリティ) | 0.2.0 | ipywidgets | 7.7.0 |
| アイソデート | 0.6.1 | itsdangerous(イッツデンジャラス) | 2.0.1 | ジェダイ | 0.18.0 |
| ジンジャ2 | 2.11.3 | jmespath | 0.10.0 | 「joblib」 | 1.0.1 |
| ジョブリブスパーク | 0.5.0 | JSONスキーマ | 3.2.0 | ジュピタークライアント | 6.1.12 |
| ジュピター・コア | 4.8.1 | jupyterlab-pygments | 0.1.2 | jupyterlab ウィジェット | 1.0.0 |
| keras | 2.8.0 | Keras-Preprocessing | 1.1.2 | キウィソルバー | 1.3.1 |
| 韓国陰暦 | 0.2.1 | 言語コード | 3.3.0 | libclang | 14.0.1 |
| lightgbm | 3.3.2 | llvmlite | 0.38.0 | LunarCalendar | 0.0.9 |
| Mako | 1.2.0 | Markdown | 3.3.6 | MarkupSafe | 2.0.1 |
| matplotlib | 3.4.3 | matplotlib-inline | 0.1.2 | missingno | 0.5.1 |
| mistune | 0.8.4 | mleap | 0.20.0 | mlflow-skinny | 1.26.0 |
| マルチメソッド | 1.8 | マーマーハッシュ (murmurhash) | 1.0.7 | nbclient(エヌビー・クライアント) | 0.5.3 |
| NBコンバート | 6.1.0 | nbフォーマット | 5.1.3 | nest-asyncio(ネスト・アサインキオ) | 1.5.1 |
| networkx | 2.6.3 | nltk | 3.6.5 | ノートブック | 6.4.5 |
| numba | 0.55.1 | NumPy (数値計算ライブラリ) | 1.20.3 | oauthlib | 3.2.0 |
| opt-einsum | 3.3.0 | パッケージング | 21.0 | パンダ | 1.3.4 |
| pandas-profiling(パンダスプロファイリング) | 3.1.0 | パンドックフィルターズ | 1.4.3 | paramiko | 2.9.2 |
| パルソ | 0.8.2 | 病気または感覚を表す用語として使用される「パシー」 | 0.6.1 | パッツィ | 0.5.2 |
| petastorm | 0.11.4 | ペキスペクト | 4.8.0 | フィック | 0.12.2 |
| ピクルシェア | 0.7.5 | 枕 | 8.4.0 | pip | 21.2.4 |
| プラットフォームディレクトリ | 2.5.2 | plotly | 5.6.0 | pmdarima | 1.8.5 |
| プレシェッド | 3.0.6 | prometheus-クライアント | 0.11.0 | prompt-toolkit(プロンプトツールキット) | 3.0.20 |
| 預言者 | 1.0.1 | プロトバフ | 3.19.4 | psutil | 5.8.0 |
| psycopg2 | 2.9.3 | ptyprocess | 0.7.0 | pyarrow (パイアロー) | 7.0.0 |
| pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 | pybind11 | 2.9.2 |
| pycparser(パイシーパーサー) | 2.20 | pydantic | 1.8.2 | パイグメンツ | 2.10.0 |
| PyGObject | 3.36.0 | PyMeeus | 0.5.11 | PyNaCl | 1.5.0 |
| pyodbc | 4.0.31 | パイパーシング (Pyparsing) | 3.0.4 | pyrsistent | 0.18.0 |
| pystan | 2.19.1.1 | python-apt | 2.0.0+ubuntu0.20.4.7 | python-dateutil (Python用の日付処理ライブラリ) | 2.8.2 |
| パイソンエディター | 1.0.4 | pytz | 2021年3月 | PyWavelets | 1.1.1 |
| PyYAML | 6.0 | pyzmq | 22.2.1 | RegEx | 2021.8.3 |
| リクエスト | 2.26.0 | requests-oauthlib | 1.3.1 | requests-unixsocket | 0.2.0 |
| RSA(アールエスエー) | 4.8 | s3transfer | 0.5.2 | sacremoses | 0.0.53 |
| scikit-learn(サイキット・ラーン) | 0.24.2 | scipy | 1.7.1 | seaborn(シーボーン) | 0.11.2 |
| Send2Trash(センド2トラッシュ) | 1.8.0 | setuptools(セットアップツール) | 58.0.4 | setuptools-git | 1.2 |
| シャープ | 0.40.0 | simplejson | 3.17.6 | 6 | 1.16.0 |
| スライサー | 0.0.7 | スマートオープン | 5.2.1 | smmap | 5.0.0 |
| spacy | 3.2.3 | spacy-legacy | 3.0.9 | スペーシー・ロガーズ | 1.0.2 |
| spark-tensorflow-distributor | 1.0.0 | sqlparse | 0.4.2 | srsly | 2.4.3 |
| ssh-import-id | 5.10 | statsmodels(スタッツモデルズ) | 0.12.2 | 一覧にする | 0.8.9 |
| 「tangled」-up-in-ユニコード | 0.1.0 | 粘り強さ | 8.0.1 | TensorBoard | 2.8.0 |
| テンソルボード・データサーバー | 0.6.1 | tensorboard-plugin-profile | 2.5.0 | テンソルボードプラグイン-WIT | 1.8.1 |
| tensorflow (CPU版) | 2.8.0 | tensorflow-estimatorツール | 2.8.0 | tensorflow-io-gcs-filesystem | 0.25.0 |
| termcolor | 1.1.0 | 終了しました | 0.9.4 | テストパス (testpath) | 0.5.0 |
| tf-estimator-nightly | 2.8.0.dev2021122109 | thinc | 8.0.15 | threadpoolctl | 2.2.0 |
| トークナイザー | 0.12.1 | 電灯 | 1.11.0 +cpu | torchvision 라이브러리 | 0.12.0+ cpu |
| 竜巻 | 6.1 | tqdm | 4.62.3 | traitlets(トレイトレット) | 5.1.0 |
| トランスフォーマー | 4.17.0 | typer | 0.4.1 | タイピング拡張 | 3.10.0.2 |
| ujson | 4.0.2 | unattended-upgrades | 0.1 | urllib3 | 1.26.7 |
| virtualenv | 20.8.0 | ビジョン | 0.7.4 | わさび | 0.9.1 |
| wcwidth(文字の幅を測定するプログラム関数) | 0.2.5 | ウェブエンコーディングス | 0.5.1 | websocket-client (ウェブソケット・クライアント) | 1.3.1 |
| Werkzeug | 2.0.2 | ホイール | 0.37.0 | widgetsnbextension | 3.6.0 |
| wrapt | 1.12.1 | xgboost | 1.5.2 | ジップ | 3.6.0 |
GPU クラスター上のPython ライブラリ
| 図書館 | バージョン | 図書館 | バージョン | 図書館 | バージョン |
|---|---|---|---|---|---|
| absl-py | 1.0.0 | Antergos Linux | 2015年10月 (ISO-Rolling) | argon2-cffi | 20.1.0 |
| アスター | 0.8.1 | astunparse | 1.6.3 | async-generator (非同期ジェネレーター) | 1.10 |
| 属性 | 21.2.0 | バックコール (再発信機能) | 0.2.0 | バックポート.entry-points-selectable | 1.1.1 |
| bcrypt | 3.2.2 | 漂白剤 | 4.0.0 | ブリス | 0.7.7 |
| boto3 | 1.21.18 | botocore | 1.24.18 | キャッシュツールズ (cachetools) | 5.1.0 |
| カタログ | 2.0.7 | サーティフィ | 2021.10.8 | cffi (CコードをPythonで呼び出すためのライブラリ) | 1.14.6 |
| チャーデット | 4.0.0 | charset-normalizer (文字コード正規化ツール) | 2.0.4 | click | 8.0.3 |
| クラウドピックル | 2.0.0 | cmdstanpy | 0.9.68 | configparser (コンフィグパーサー) | 5.2.0 |
| 日付変換 | 2.4.0 | 暗号 | 3.4.8 | サイクリスト | 0.10.0 |
| サイメム | 2.0.6 | Cython | 0.29.24 | databricks-automl-runtime(データブリックス・オートエムエル・ランタイム) | 0.2.8 |
| databricks-cli | 0.16.4 | dbl-tempo | 0.1.12 | dbus-python | 1.2.16 |
| debugpy | 1.4.1 | デコレータ | 5.1.0 | デフューズドXML (defusedxml) | 0.7.1 |
| ディル | 0.3.4 | ディスクキャッシュ | 5.4.0 | distlib | 0.3.4 |
| ディストリビューション情報 | 0.23ubuntu1 | 入口点 | 0.3 | エフェム | 4.1.3 |
| ファセット概要 | 1.0.0 | fasttext(ファーストテキスト) | 0.9.2 | ファイルロック | 3.3.1 |
| Flask | 1.1.2 | フラットバッファーズ | 2.0 | fsspec | 2021年8月1日 |
| 未来 | 0.18.2 | ガスト | 0.5.3 | ギットディービー | 4.0.9 |
| GitPython | 3.1.27 | google-auth(Google認証) | 2.6.0 | google-auth-oauthlib | 0.4.6 |
| グーグルパスタ | 0.2.0 | grpcio | 1.44.0 | ガニーコーン (gunicorn) | 20.1.0 |
| gviz-api | 1.10.0 | h5py | 3.3.0 | ヒジュリ変換器 | 2.2.3 |
| holidays | 0.13 | ホロヴォド | 0.24.3 | HTML最小化ツール(htmlmin) | 0.1.12 |
| huggingface-hub(ハギングフェイスのハブ) | 0.6.0 | idna | 3.2 | イメージハッシュ (ImageHash) | 4.2.1 |
| imbalanced-learn(不均衡データに対応するための機械学習ライブラリ) | 0.8.1 | importlib-metadata | 4.8.1 | ipykernel | 6.12.1 |
| ipython | 7.32.0 | ipython-genutils (IPython用のユーティリティ) | 0.2.0 | ipywidgets | 7.7.0 |
| アイソデート | 0.6.1 | itsdangerous(イッツデンジャラス) | 2.0.1 | ジェダイ | 0.18.0 |
| ジンジャ2 | 2.11.3 | jmespath | 0.10.0 | 「joblib」 | 1.0.1 |
| ジョブリブスパーク | 0.5.0 | JSONスキーマ | 3.2.0 | ジュピタークライアント | 6.1.12 |
| ジュピター・コア | 4.8.1 | jupyterlab-pygments | 0.1.2 | jupyterlab ウィジェット | 1.0.0 |
| keras | 2.8.0 | Keras-Preprocessing | 1.1.2 | キウィソルバー | 1.3.1 |
| 韓国陰暦 | 0.2.1 | 言語コード | 3.3.0 | libclang | 14.0.1 |
| lightgbm | 3.3.2 | llvmlite | 0.38.0 | LunarCalendar | 0.0.9 |
| Mako | 1.2.0 | Markdown | 3.3.6 | MarkupSafe | 2.0.1 |
| matplotlib | 3.4.3 | matplotlib-inline | 0.1.2 | missingno | 0.5.1 |
| mistune | 0.8.4 | mleap | 0.20.0 | mlflow-skinny | 1.26.0 |
| マルチメソッド | 1.8 | マーマーハッシュ (murmurhash) | 1.0.7 | nbclient(エヌビー・クライアント) | 0.5.3 |
| NBコンバート | 6.1.0 | nbフォーマット | 5.1.3 | nest-asyncio(ネスト・アサインキオ) | 1.5.1 |
| networkx | 2.6.3 | nltk | 3.6.5 | ノートブック | 6.4.5 |
| numba | 0.55.1 | NumPy (数値計算ライブラリ) | 1.20.3 | oauthlib | 3.2.0 |
| opt-einsum | 3.3.0 | パッケージング | 21.0 | パンダ | 1.3.4 |
| pandas-profiling(パンダスプロファイリング) | 3.1.0 | パンドックフィルターズ | 1.4.3 | paramiko | 2.9.2 |
| パルソ | 0.8.2 | 病気または感覚を表す用語として使用される「パシー」 | 0.6.1 | パッツィ | 0.5.2 |
| petastorm | 0.11.4 | ペキスペクト | 4.8.0 | フィック | 0.12.2 |
| ピクルシェア | 0.7.5 | 枕 | 8.4.0 | pip | 21.2.4 |
| プラットフォームディレクトリ | 2.5.2 | plotly | 5.6.0 | pmdarima | 1.8.5 |
| プレシェッド | 3.0.6 | prompt-toolkit(プロンプトツールキット) | 3.0.20 | 預言者 | 1.0.1 |
| プロトバフ | 3.19.4 | psutil | 5.8.0 | psycopg2 | 2.9.3 |
| ptyprocess | 0.7.0 | pyarrow (パイアロー) | 7.0.0 | pyasn1 | 0.4.8 |
| pyasn1-modules | 0.2.8 | pybind11 | 2.9.2 | pycparser(パイシーパーサー) | 2.20 |
| pydantic | 1.8.2 | パイグメンツ | 2.10.0 | PyGObject | 3.36.0 |
| PyMeeus | 0.5.11 | PyNaCl | 1.5.0 | pyodbc | 4.0.31 |
| パイパーシング (Pyparsing) | 3.0.4 | pyrsistent | 0.18.0 | pystan | 2.19.1.1 |
| python-apt | 2.0.0+ubuntu0.20.4.7 | python-dateutil (Python用の日付処理ライブラリ) | 2.8.2 | パイソンエディター | 1.0.4 |
| pytz | 2021年3月 | PyWavelets | 1.1.1 | PyYAML | 6.0 |
| pyzmq | 22.2.1 | RegEx | 2021.8.3 | リクエスト | 2.26.0 |
| requests-oauthlib | 1.3.1 | requests-unixsocket | 0.2.0 | RSA(アールエスエー) | 4.8 |
| s3transfer | 0.5.2 | sacremoses | 0.0.53 | scikit-learn(サイキット・ラーン) | 0.24.2 |
| scipy | 1.7.1 | seaborn(シーボーン) | 0.11.2 | Send2Trash(センド2トラッシュ) | 1.8.0 |
| setuptools(セットアップツール) | 58.0.4 | setuptools-git | 1.2 | シャープ | 0.40.0 |
| simplejson | 3.17.6 | 6 | 1.16.0 | スライサー | 0.0.7 |
| スマートオープン | 5.2.1 | smmap | 5.0.0 | spacy | 3.2.3 |
| spacy-legacy | 3.0.9 | スペーシー・ロガーズ | 1.0.2 | spark-tensorflow-distributor | 1.0.0 |
| sqlparse | 0.4.2 | srsly | 2.4.3 | ssh-import-id | 5.10 |
| statsmodels(スタッツモデルズ) | 0.12.2 | 一覧にする | 0.8.9 | 「tangled」-up-in-ユニコード | 0.1.0 |
| 粘り強さ | 8.0.1 | TensorBoard | 2.8.0 | テンソルボード・データサーバー | 0.6.1 |
| tensorboard-plugin-profile | 2.5.0 | テンソルボードプラグイン-WIT | 1.8.1 | テンソルフロー | 2.8.0 |
| tensorflow-estimatorツール | 2.8.0 | tensorflow-io-gcs-filesystem | 0.25.0 | termcolor | 1.1.0 |
| 終了しました | 0.9.4 | テストパス (testpath) | 0.5.0 | tf-estimator-nightly | 2.8.0.dev2021122109 |
| thinc | 8.0.15 | threadpoolctl | 2.2.0 | トークナイザー | 0.12.1 |
| 電灯 | 1.11.0+cu113 | torchvision 라이브러리 | 0.12.0+cu113 | 竜巻 | 6.1 |
| tqdm | 4.62.3 | traitlets(トレイトレット) | 5.1.0 | トランスフォーマー | 4.17.0 |
| typer | 0.4.1 | タイピング拡張 | 3.10.0.2 | ujson | 4.0.2 |
| unattended-upgrades | 0.1 | urllib3 | 1.26.7 | virtualenv | 20.8.0 |
| ビジョン | 0.7.4 | わさび | 0.9.1 | wcwidth(文字の幅を測定するプログラム関数) | 0.2.5 |
| ウェブエンコーディングス | 0.5.1 | websocket-client (ウェブソケット・クライアント) | 1.3.1 | Werkzeug | 2.0.2 |
| ホイール | 0.37.0 | widgetsnbextension | 3.6.0 | wrapt | 1.12.1 |
| xgboost | 1.5.2 | ジップ | 3.6.0 |
Python モジュールを含む Spark パッケージ
| Spark パッケージ | Python モジュール | バージョン |
|---|---|---|
| graphframes | graphframes | 0.8.2-db1-spark3.2 |
R ライブラリ
R ライブラリは、Databricks Runtime 11.0 の R ライブラリと同じです。
Javaおよび Scala ライブラリ (Scala 2.12 クラスター)
Databricks Runtime 11.0 のJavaライブラリと Scala ライブラリに加えて、Databricks Runtime 11.0 ML には次の JAR が含まれています。
CPU クラスター
| グループ識別子 | アーティファクト ID | バージョン |
|---|---|---|
| com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
| ml.combust.mleap | mleap-databricks-runtime_2.12 | 0.18.1-23eb1ef |
| ml.dmlc | xgboost4j-spark_2.12 | 1.5.2 |
| ml.dmlc | xgboost4j_2.12 | 1.5.2 |
| org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
| org.mlflow | mlflow-client | 1.26.0 |
| org.mlflow | mlflow-spark | 1.26.0 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |
GPU クラスター
| グループ識別子 | アーティファクト ID | バージョン |
|---|---|---|
| com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
| ml.combust.mleap | mleap-databricks-runtime_2.12 | 0.18.1-23eb1ef |
| ml.dmlc | xgboost4j-spark_2.12 | 1.5.2 |
| ml.dmlc | xgboost4j_2.12 | 1.5.2 |
| org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
| org.mlflow | mlflow-client | 1.26.0 |
| org.mlflow | mlflow-spark | 1.26.0 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |