LALAL.AIには、あなたの心を吹き飛ばす新しいカシオペアアルゴリズムがあります

実際の語幹がなくても曲のさまざまな部分を分離することは困難ですが、プロセスを処理できるLALAL.AIというツールがあります。最小限の労力で、オーディオエンジニアリングのスキルを必要とせずに、ボーカルとインストゥルメンタルの間で曲を分割します。

LALAL.AIはすでに非常に堅実でしたが、最近、Cassiopeiaと呼ばれる新しいニューラルネットワークアーキテクチャの導入のおかげで大きな前進を遂げました。これは、サービスの前世代のニューラルネットワークであるRocknetを採用し、ほぼすべての点でそれを改善します。

LALAL.AIのカシオペアは何をもたらしますか?

簡単に言うと、Cassiopeiaは、オーディオアーティファクトを大幅に減らして分割結果を改善します。 LALAL.AIの全体的な目的は、ボーカルと楽器をトラックから引き出して分離することです。そのため、機能を向上させることができる機能を持つことは素晴らしいことです。

新しいニューラルネットワークでは、LALAL.AIが分割トラックを生成するのに少し時間がかかりますが、これは品質の大幅な向上との小さなトレードオフです。

では、何が違うのでしょうか?基本的に、LALAL.AIで引き続き使用可能なRocknetは、位相成分を無視して振幅成分のみを考慮します。新しいCassiopeiaニューラルネットワークは、入力信号の位相成分を考慮して、出力信号の位相を生成します。このプロセスにより、分割されたトラックに含まれるオーディオアーティファクトが少なくなります。

これらすべてを簡単に言えば、新しいアルゴリズムは曲をより深く分析して、より良いスプリットを作成します。

そのサービスがより効果的に機能することを証明するために、LALAL.AIはSpleeter、OpenUnmix、ExtendedUnmixに対してテストしました。また、結果を独自のRocknetニューラルネットワークと比較しました。テストの全結果はLALAL.AIのブログで見ることができますが、基本的に、カシオペアは、ジャズ、ソフトロック、ポップなど、ランダムに選択されたさまざまなジャンルで、ほとんどのカテゴリで他のすべてを上回りました。

興味深いことに、ロックネットはまだボーカルチャンネルでより良いパフォーマンスを発揮します。カシオペアは、インストルメンタルからボーカルへの浸透がわずかに多くなっています。ただし、LALAL.AIは、数値が必ずしも全体像を示しているわけではなく、実際には音質がテストで示されているものと異なる場合があると指摘しました。

同社がこの件について言ったことは次のとおりです。

カシオペアはボーカルの正式なメトリクスの点でロックネットに遅れをとっていますが、インストルメンタル部分と特にカシオペアによって分離されたボーカルステムは、他のソリューションの特徴である金属的な響きのアーティファクトがなく、ロックネットよりもはるかに自然で柔らかく聞こえます。

私は自分で結果をテストしましたが、カシオペアニューラルネットワークがよりクリーンなオーディオスプリットをもたらすことがわかりました。ボーカルトラックには、インストルメンタルからの知覚可能な浸透はほとんどありませんでした。これは、LALAL.AIのようなツールにまさに必要なものです。

そうは言っても、ロックネットの結果はまだかなり良好で、ボーカルトラックをインストゥルメンタルから分離するのに絶対に使用できました。

LALAL.AIの新しいカシオペア機能をどのように試しますか?

新しいニューラルネットワークを試してみたい場合は、 LALAL.AIにアクセスして、曲をアップロードするときに画面の下部にある[新しいアルゴリズムを使用する]チェックボックスがオンになっていることを確認してください

アルゴリズムがトラックを分割するために使用する攻撃性のレベルを選択することもできます。 Normalはほとんどのトラックに適していますが、MildとAggressiveを試して、より良いトラックを作成するものを確認できます。