github VOICEVOX/voicevox_engine 0.15.0
VOICEVOX ENGINE 0.15.0

latest releases: 0.22.0-dev, 0.21.1, 0.21.0...
9 months ago
  • /validate_kana APIを追加
  • 起動時のエンジン設定項目追加
  • ユーザー辞書のインポート・エクスポート機能追加
  • ビルド成果物のディレクトリ構造を変更
  • 書き込み系APIを一括で無効化可能に
  • 開発環境の向上
  • バグ修正

パッケージ案内

What's Changed

  • Fix: Typo修正 by @sevenc-nanashi in #600
  • /settingのAllow Originを設定しても正しく認識しない by @whiteball in #601
  • pysen lint extrasの利用をやめ、linterを更新する by @aoirint in #608
  • doc: Docker実行コマンドの表記ゆれを修正する by @aoirint in #610
  • DockerでGPUを使用する時に問題が発生したらランタイムとしてnvidiaを直接指定するようにREADME.mdに記載する (#585) by @okaits in #599
  • add: voicevox-clientのラッパー紹介 by @tuna2134 in #614
  • Add: boolのエラーハンドリングを追加 by @sevenc-nanashi in #615
  • マルチエンジン周りのドキュメントを追加 by @Hiroshiba in #617
  • FIX: update_dictのエラーハンドリングを改善 by @sabonerune in #620
  • FIX: デフォルト以外のサンプリングレートで正常にモーフィングができない問題への対策 by @sabonerune in #622
  • Add: ライブラリのダウンロードAPIを実装 by @sevenc-nanashi in #616
  • EngineManifestの変更にEngineManifestLoaderを追従させる by @takana-v in #632
  • SettingLoaderのテストを追加 by @My-MC in #587
  • update_dictのリファクタリング by @Hiroshiba in #630
  • add: DockerHub で提供されているイメージに arm 版を追加 by @K-shir0 in #639
  • build: Bump numpy, pyworld, scipy, and pyopenjtalk to the latest for macOS Big Sur+ by @siketyan in #645
  • Fix: engine_manifest.jsonのversionを置き換えるように by @sevenc-nanashi in #643
  • READMEにDiscordへの案内を追加 by @Hiroshiba in #658
  • マルチエンジンのドキュメントを追加してとりあえず対応エンジンを作成可能にする by @Hiroshiba in #657
  • BLD: Pyinstallerの更新 by @sabonerune in #653
  • READMEのサンプルのリクエスト先をlocalhostを127.0.0.1に変更 by @Hiroshiba in #659
  • Docker イメージをリリース時にテストするように追加 & ubuntu18 をベースとしたイメージのサポートを終了 by @K-shir0 in #650
  • 非推奨化されたdistutils.versionへの依存をなくし、python-semverに移行する by @aoirint in #609
  • BLD: PyInstallerのバージョンを5.7.0未満に戻す by @sabonerune in #661
  • Python 3.11.3に更新する by @aoirint in #662
  • SecretsのDOCKERHUB_USERNAMEをVariablesに移行する by @aoirint in #667
  • RESOURCE内のclean_character_info.pyスクリプトを利用する by @Hiroshiba in #664
  • Dockerリリース時テストのバージョンパラメータに空文字列が渡されて失敗するのを修正 by @aoirint in #666
  • FIX: 生成されたpysenの設定を更新 by @sabonerune in #671
  • READMEにヘルプの内容を記載 by @Hiroshiba in #672
  • Github Actionsでのビルドのupload/download回数を少なくしてビルド時間を短くする by @Hiroshiba in #668
  • ヘルプの抜けを修正 by @takana-v in #673
  • AquesTalk記法のバリデータ (#315) by @FujisakiEx in #681
  • installed_library APIの改善 by @y-chan in #691
  • uninstall library APIの追加 by @y-chan in #692
  • Github Actionsでshell: bashを毎回書かなくても良いようにする by @Hiroshiba in #697
  • build.ymlでGNU版のsedとsplitをenvに入れて明示的に実行 by @Hiroshiba in #702
  • CI: バイナリビルド成果物の構成時に共有ライブラリの実体をmvするように変更 by @aoirint in #700
  • バイナリビルドCI: 7zとVVPPが同時にCIストレージ容量を消費しないようにする by @aoirint in #696
  • vvlib_manifest.jsonをバリデートするようにする by @y-chan in #694
  • EngineManifestモデルの追加機能群をOptionalにする by @y-chan in #704
  • engine_manifest.jsonを読み込むディレクトリをエンジンのルートに変更する by @y-chan in #703
  • 音声ライブラリ管理APIのエラーにライブラリIDを含める by @y-chan in #705
  • VvlibManifestモデルのスキーマを手動でOpenAPIに追加する by @y-chan in #706
  • CUDA 11.8.0, cuDNN 8.9.2に更新 by @aoirint in #695
  • DockerビルドCI: リリースビルド時にlatest(masterブランチ)のレイヤーキャッシュを使うようにする by @aoirint in #707
  • DockerビルドCI: リリースビルド時にレイヤーキャッシュをpushしないようにする by @aoirint in #708
  • Github Actions とpre-commitにpoetry exportを適用 by @FujisakiEx in #716
  • BLD: pyopenjtalkを更新 by @sabonerune in #717
  • ビルド時のmodelディレクトリの指定をオプショナルにする by @Hiroshiba in #725
  • コアをロードするときにログを出すようにする by @Hiroshiba in #722
  • poetry updateを実行しました。 by @stmtk1 in #727
  • versionを取得するe2eテストを書く by @stmtk1 in #732
  • platformdirsをインストールしました by @stmtk1 in #736
  • MSVC 14.37の仕様変更への対応 by @My-MC in #744
  • Update README.md by @nagi-miaow in #743
  • e2eテストのTestClientをfixtureにする by @Hiroshiba in #737
  • apt-get update before install libsnbfile1 by @raa0121 in #746
  • ENH: リサンプリングのパッケージをscipyからsoxrに変更 by @sabonerune in #749
  • バイナリビルドCI: VVPPを圧縮しながら分割してCIストレージ容量を節約する by @aoirint in #754
  • プリセットファイルのパスを起動引数・環境変数で変更できるようにする by @aoirint in #711
  • run.py: __main__実装をmain関数スコープに移動させる by @aoirint in #761
  • /connect_waves: HTTPExceptionをreturnではなくraiseするように修正 by @aoirint in #763
  • PyInstaller 5.13.2に更新 by @aoirint in #765
  • run.py: ルーティング関数の戻り値に型ヒントを追加 by @aoirint in #764
  • CancellableEngineが必要な引数だけを受け取るようにする by @aoirint in #762
  • mypy 1.6.0に更新 by @aoirint in #767
  • FastAPI 0.103.2に更新 by @aoirint in #766
  • poetry.lock: content-hashを再生成 by @aoirint in #768
  • ENH: soundfileの更新 by @sabonerune in #769
  • スタイルID(style_id)のことを話者ID(speaker_id)としているコードを全部置き換える by @weweweok in #741
  • 辞書にNemoを追加 by @Hiroshiba in #774
  • ドキュメントからspeakerになっていることの案内を消す by @Hiroshiba in #772
  • mainブランチ更新時に最新版が-devにリリースされるようにする by @Hiroshiba in #771
  • BaseLibraryInfoモデル(+α)の追加と、LibraryManagerクラスがあるファイルのリネーム by @y-chan in #776
  • acoustic_feature_extractor.py 不使用要素の削除 by @tarepan in #781
  • BasePhoneme 不使用メソッドの削除 by @tarepan in #782
  • _synthesis_impl() 前処理の関数化 by @tarepan in #784
  • BasePhoneme 基底クラスの廃止 by @tarepan in #789
  • OjtPhoneme.convert() の廃止 by @tarepan in #791
  • [docs] TwitterをXに by @Hiroshiba in #793
  • Core関数docstringの移植 by @tarepan in #795
  • to_phoneme_data_list() の廃止 by @tarepan in #797
  • FIX: arm64環境でDockerが動作しない問題へのワークアラウンド by @sabonerune in #806
  • generate_frame_scale_features の解体 by @tarepan in #790
  • 追加: SynthesisEngine Core情報都度取得 by @tarepan in #803
  • 廃止: OjtPhoneme.__eq__() by @tarepan in #800
  • 追加: OjtPhoneme.onehot() float 出力 by @tarepan in #810
  • 整理: .default_sampling_rate 移植 by @tarepan in #812
  • 修正: AquesTalk風記法の旧式記述を置換 by @tarepan in #818
  • 整理: 前後空白挿入の統合 by @tarepan in #814
  • 整理: 実質プライベート変数の変数名プライベート化 by @tarepan in #821
  • actionsをアップデートする by @takana-v in #748
  • 整理: Coreロードの型付け・変数名 by @tarepan in #805
  • 廃止: OjtPhoneme start / end by @tarepan in #811
  • ユーザー辞書のインポート、エクスポートをUIに追加 by @My-MC in #676
  • 整理: docstring追加 by @tarepan in #817
  • 整理: PresetManager 共通処理の関数化・追加コメント by @tarepan in #832
  • 整理: グローバル特徴量適用の関数化 by @tarepan in #819
  • 整理: default_setting.yml 拡張子変更 by @tarepan in #837
  • Refactor: frame_per_mora による置き換え by @tarepan in #841
  • 整理: フレーム計算の _to_frame による共通化 by @tarepan in #844
  • 整理: コアCDLL型付けの切り出し by @tarepan in #843
  • 整理: default_setting.yaml の廃止 by @tarepan in #855
  • 整理: OjtPhoneme クラス変数のプライベート化 by @tarepan in #846
  • 整理: 貢献者ガイド節への集約 by @tarepan in #838
  • issue-labelerのバージョンを修正 by @takana-v in #831
  • 整理: MetaStore.py docstringの追加 by @tarepan in #845
  • 整理: LibraryManager docstring・型の追加 by @tarepan in #833
  • 整理: round 挙動メモの追加 by @tarepan in #852
  • READMEをユーザーガイド・開発者+貢献者ガイドに区分化 by @Hiroshiba in #858
  • 整理: ユーザー辞書のdocstring・変数名・型・コメント by @tarepan in #836
  • 追加: 辞書インポート・エクスポートガイド by @tarepan in #861
  • 整理: ドキュメント生成の build_util 移植 by @tarepan in #866
  • 修正: tag 付け直しによる release latest-dev の更新 by @tarepan in #856
  • 整理: Query全体パラメータ適用の移植 by @tarepan in #840
  • 整理: speaker_info API内部実装単純化 by @tarepan in #849
  • 整理: pre_process の細分化 by @tarepan in #851
  • 整理: TTS系ディレクトリ構造の改善 by @tarepan in #867
  • 整理: ビルドツールの移動 by @tarepan in #874
  • 廃止: MetasStore の不使用関数 by @tarepan in #875
  • hotfix/build_utilディレクトリ内のスクリプトのDockerfile内でのコピーを正しい形に by @Hiroshiba in #878
  • [hotfix] Dockerfileのディレクトリ以下へのコピーのスラッシュ忘れ by @Hiroshiba in #879
  • 整理: フルコンテキストラベル関連コメント/docstring/型ヒント by @tarepan in #880
  • 追加: 統一ドメイン用語 音声合成用のクエリ by @tarepan in #863
  • 追加: 音声ライブラリ自動読み込み docs by @tarepan in #869
  • Refactor: テスト不使用変数削除とutilityによる簡略化 by @tarepan in #882
  • 修正: 辞書更新時のファイルリネームエラー by @tarepan in #884
  • 整理: AquesTalk風記法パース規則コメントの追加 by @tarepan in #864
  • BLD: PyInstallerをv6へ更新 by @sabonerune in #857
  • hotifx: NumPy の deprecated な cast by @tarepan in #888
  • 整理: _synthesis_impl 前処理/後処理の関数化 by @tarepan in #873
  • 整理: Ojtドメイン変換切り出しと集約 by @tarepan in #889
  • 整理: OpenJTalk 系の不使用メソッド削除 by @tarepan in #890
  • 整理: テスト用メソッド切り出し by @tarepan in #891
  • 整理: フレーム数カウント共通化 by @tarepan in #898
  • 整理: SynthesisEngineTTSEngine 改名 by @tarepan in #870
  • 追加: 波形合成後処理のテスト by @tarepan in #902
  • 整理: 簡易 docstring と単純変数名 by @tarepan in #903
  • 整理: 波形合成前処理の関数ネスト廃止 by @tarepan in #907
  • 整理: OpenJTalk PhonemeLabel リネーム by @tarepan in #893
  • 整理: 疑問形 upspeak の単純化 by @tarepan in #904
  • 整理: 合成エンジン生成のコメント追加 by @tarepan in #868
  • 整理: コア管理機能を CoreEngine へ分割 by @tarepan in #872
  • 整理: test_full_context_label.py 簡略化 by @tarepan in #906
  • 整理: replace_phoneme_length() の見通し改善 by @tarepan in #909
  • ENH: Numpyを更新 by @sabonerune in #911
  • 整理: 重複波形合成テストの廃止 by @tarepan in #912
  • 整理: OpenJTalkドメインの隔離 by @tarepan in #901
  • 修正: 定義無しMora引数の削除 by @tarepan in #914
  • 整理: APIドキュメント生成コードの段階化 by @tarepan in #865
  • 整理: CDLL型付けの切り出し by @tarepan in #862
  • 削除: Utterance.phonemes 内コンテキスト更新 by @tarepan in #905
  • FIX: プロパティ名のミスを修正 by @sabonerune in #922
  • 整理: CoreAdaptor ファサード機能 by @tarepan in #915
  • 修正: _synthesis_impl() の直接コール by @tarepan in #916
  • 廃止: フルコンテキストラベル系 set_context() by @tarepan in #917
  • 整理: .phonemes -> .labels リネーム by @tarepan in #918
  • 整理: OjtPhonemePhoneme リネーム by @tarepan in #920
  • 整理: フルコンテキストラベル系クラスのリネーム by @tarepan in #919
  • 追加: コア Mock by @tarepan in #923
  • /speakers APIを叩くe2eテストを追加 by @Hiroshiba in #925
  • 整理: 疑問文 upspeak テスト by @tarepan in #921
  • 整理: フルコンテキストラベルの見通し改善 by @tarepan in #926
  • 整理: コア機能アクセスの分離 by @tarepan in #927
  • 追加: MockCoreWrapper における生成 by @tarepan in #928
  • 追加: AquesTalk風記法の定義節 by @tarepan in #820
  • 整理: ._synthesis_impl() の廃止 by @tarepan in #930
  • 整理: core_adapter モジュール切り出し by @tarepan in #932
  • 整理: apply_interrogative_upspeak() 移植 by @tarepan in #933
  • 整理: TTSサブモジュールリネーム by @tarepan in #934
  • 整理: 初期化時の cores 取得 by @tarepan in #929
  • [docs] スピーカー→話者 by @Hiroshiba in #827
  • ライブラリ管理未対応だったらAPIが実装されないように変更 by @Hiroshiba in #886
  • 書き込み系のAPIを一括で無効化する引数・環境変数を追加 by @Hiroshiba in #895
  • 追加: TTSEngine に近いモック by @tarepan in #936
  • 整理: get_cores()synthesis_engines の分離 by @tarepan in #938
  • FIX: 型関係のバグを修正 by @sabonerune in #940
  • 整理: コア生成とTTSEngine生成の分離 by @tarepan in #937
  • 整理: mora_list 型 by @tarepan in #941
  • ENH: mypyを有効化 by @sabonerune in #943
  • mypy用のignoreをいっぱい失くす by @Hiroshiba in #946
  • 廃止: TTSEngineBase by @tarepan in #950
  • 追加: MockCoreWrapper 入力反映出力 by @tarepan in #951
  • 整理: mora_list 無子音表現 by @tarepan in #953
  • 整理: モック decode_forward() 簡略化 by @tarepan in #955
  • 整理: 音素長・ピッチテストの構造化 by @tarepan in #952
  • 整理: コア生成のモジュール移植 by @tarepan in #947
  • 整理: アクセント句生成の簡略化 by @tarepan in #957
  • 整理: MockTTSEngine 純モック化 by @tarepan in #948
  • 整理: synthesis_engines 関連名のリネーム by @tarepan in #949
  • POST /user_dict_wordのテスト追加 by @Hiroshiba in #945
  • TYP: 全てのファイルをmypyの対象にする by @sabonerune in #959
  • MAINT: 未使用の依存パッケージを削除 by @sabonerune in #962
  • 廃止: __eq__ by @tarepan in #961
  • 追加: StyleId 型 by @tarepan in #965
  • 追加: OjtPhoneme 型 by @tarepan in #958
  • 追加: 音素 Literal 型 by @tarepan in #942
  • audio_queryのe2eテスト by @Hiroshiba in #967
  • 整理: 名前付き引数削除 by @tarepan in #968
  • FIX: 未処理の例外が発生するとCORSMiddlewareが適用されない問題に対するワークアラウンド by @sabonerune in #969
  • APIのstyle_idの型をStyleId型に by @Hiroshiba in #966
  • 整理: TTSEngine メソッドのリネーム by @tarepan in #956
  • 追加: テキスト分析のテスト by @tarepan in #970
  • 整理: Label context 個別属性のアクセッサ by @tarepan in #971
  • 廃止: split_mora() 不使用返り値 by @tarepan in #973
  • 整理: update_length_and_pitch() by @tarepan in #975
  • 追加: コアモック出力値の統一 by @tarepan in #977
  • 追加: kana 型 by @tarepan in #972
  • 整理: テスト入力生成ユーティリティ by @tarepan in #979
  • モーフィング関係で、スタイルIDなのにspeakerになっているところをstyle_idに変更 by @Hiroshiba in #826
  • 整理: replace_mora_pitch by @tarepan in #974
  • 整理: split_mora by @tarepan in #984
  • 追加: update_length() スナップショット by @tarepan in #978
  • 追加: create_accent_phrases() 異常系テスト by @tarepan in #982
  • 追加: TTSEngine.create_accent_phrases_from_kana() by @tarepan in #983
  • TYP: numpyの型情報を追加 by @sabonerune in #988
  • FIX: morphable_targetsエンドポイントのAPIが変わってしまっていたので修正 by @sabonerune in #991
  • cors_policy_mode, allow_originの優先度についてhelpオプションに追加 by @tomoish in #985
  • 設定ページをVueに、POST /settingでhtmlが返らないように変更、デザイン調整 by @Hiroshiba in #885
  • 整理: tts_pipeline テストディレクトリ by @tarepan in #986
  • 廃止: pre_process() by @tarepan in #976
  • 整理: _create_one_hot() by @tarepan in #990
  • 廃止: TTS 関連 __init__.py by @tarepan in #987
  • 整理: old test の移植 by @tarepan in #994
  • pyinstallerのbootloaderの自前ビルドにおまじない効果があるっぽいことをコメント追記する by @Hiroshiba in #980
  • 整理: test_mora_to_text.py 移植 by @tarepan in #996
  • 整理: 音素識別のメソッド化 by @tarepan in #993
  • 整理: 波形合成テストの分離 by @tarepan in #998
  • numpy.ndarrayのほぼ全てに型を付ける by @Hiroshiba in #989
  • 整理: 無音付加を CoreAdapter へ移植 by @tarepan in #999
  • 廃止: split_mora() by @tarepan in #1000
  • 整理: length 無音付加のCoreAdapter 移植 by @tarepan in #1001
  • 整理: .phoneme_id 属性リネーム by @tarepan in #1003
  • OpenAPIのスナップショットテスト追加&不要なQueryを省く by @Hiroshiba in #992
  • style_id引数やAPIをspeakerに戻す by @Hiroshiba in #1016
  • [release-0.15] to 0.15.0 by @Hiroshiba in #1018
  • [release-0.15] ビルド後テストの修正漏れ by @Hiroshiba in #1019

New Contributors

Full Changelog: 0.14.7...0.15.0

Don't miss a new voicevox_engine release

NewReleases is sending notifications on new releases.