ar+nar-len-llama-8Model (
nar-len)
			This is from a snapshot of the weights post-training for NAR-len modality.
			Average WER: 0.104
Average CER: 0.058
Average SIM-O: 0.883
		
| Text | WER↓ | CER↓ | SIM-O↑ | Prompt | Our VALL-E | Original VALL-E | Ground Truth | 
|---|---|---|---|---|---|---|---|
| Number ten, fresh nelly is waiting on you, good night husband. | 0.000 | 0.000 | 0.672 | ||||
| Yea, his honourable worship is within, but he hath a godly minister or two with him, and likewise a leech. | 0.100 | 0.055 | 0.965 | ||||
| Instead of shoes, the old man wore boots with turnover tops, and his blue coat had wide cuffs of gold braid. | 0.000 | 0.000 | 0.895 | ||||
| The army found the people in poverty and left them in comparative wealth. | 0.000 | 0.000 | 0.934 | ||||
| Thus did this humane and right minded father comfort his unhappy daughter, and her mother embracing her again, did all she could to soothe her feelings. | 0.192 | 0.137 | 0.773 | ||||
| He was in deep converse with the clerk and entered the hall holding him by the arm. | 0.000 | 0.000 | 0.938 | ||||
| They moved thereafter cautiously about the hut groping before and about them to find something to show that Warrenton had fulfilled his mission. | 0.217 | 0.092 | 0.828 | ||||
| And lay me down in thy cold bed and leave my shining lot. | 0.077 | 0.090 | 0.871 | 
| Text | WER↓ | CER↓ | SIM-O↑ | Prompt | Our VALL-E | Ground Truth | 
|---|---|---|---|---|---|---|
| I can't tell you how glad I am to have you so pretty and comfortable here, and to hear everyone saying such nice things about you. | 0.000 | 0.000 | 0.934 | |||
| The other is a mythological subject of deeper meaning, the death of Procrus. | 0.077 | 0.051 | 0.934 | |||
| And yet, that something must be playful in its nature. | 0.000 | 0.000 | 0.863 | |||
| Each day has its own great gree for its little care. | 0.091 | 0.018 | 0.930 | |||
| It seems to be easier than it is, I begin to think, replied Philip. | 0.000 | 0.000 | 0.969 | |||
| He rode before a portmanteau and called himself Ashburnham's servant. | 0.200 | 0.151 | 0.828 | |||
| Unless you speak more fully senora, I cannot understand you. replied her husband. | 0.000 | 0.000 | 0.773 | |||
| It did not beckon, or indeed move at all. It was as still as the hand of death. | 0.059 | 0.037 | 0.844 | |||
| Lafe and grim shall be the same kind of friends to your two sons. | 0.071 | 0.029 | 0.918 | |||
| real dishonor consistent sin, and real honor in virtue. | 0.333 | 0.210 | 0.852 | |||
| On the palm were three little pyramids of black, doughy clay. | 0.000 | 0.000 | 0.875 | |||
| Most people talk too much, so it is a relief to find one who talks too little. | 0.000 | 0.000 | 0.961 | |||
| One evening there came a sudden flash of fire and a sputtering, sizzling noise. | 0.000 | 0.000 | 0.902 | |||
| Well, you are sad every day. | 0.000 | 0.000 | 0.844 | |||
| This invidious traditional distinction has not lost its force even among the more advanced people of today. | 0.062 | 0.027 | 0.938 | |||
| That's a poor saying," said Amiel, stooping over to wipe his hands in the wet grass. | 0.000 | 0.000 | 0.910 | |||
| If I must say it, Mother, I want to go away and get out of this dead level. | 0.000 | 0.000 | 0.836 | |||
| Don't know, most everything she says sounds like the Bible or Shakespeare to me. | 0.000 | 0.000 | 0.930 | |||
| He worked me very hard. He wanted to be beating me all the time. | 0.000 | 0.000 | 0.781 | |||
| I gave her a spray of lilac. I remember and you gave her a friend. | 0.133 | 0.133 | 0.926 | |||
| He was handsome and bold and pleasant, offhand and gay and kind. | 0.500 | 0.338 | 0.914 | |||
| If I had only seen her, I should have declared it to be a vision, but I spoke to her. | 0.000 | 0.000 | 0.926 | |||
| The Count advanced a step towards his friend and pressed him warmly in his arms. | 0.000 | 0.000 | 0.883 | |||
| I just touched something soft. On the instant Joyce was at her side with a candle. | 0.067 | 0.048 | 0.801 | |||
| The story won't tell," said Douglas, not in any literal vulgar way. | 0.000 | 0.000 | 0.906 | |||
| Why don't you do flowers and houses, Olive? inquired serosalicitously. | 0.700 | 0.347 | 0.895 | |||
| There it clothed itself in word masks, in metaphor rags. | 0.100 | 0.017 | 0.887 | |||
| The stars began to crumble and a cloud of fine stardust fell through space. | 0.214 | 0.089 | 0.836 | |||
| Among the exhibits of that exposition was the Edison system of incandescent lighting. | 0.000 | 0.000 | 0.855 | |||
| What did old mom be the witch do with the powder of life your husband gave her? Ask the boy. | 0.105 | 0.040 | 0.949 | |||
| apathy and disgust commonly follows satiated lust. | 0.857 | 0.421 | 0.969 | |||
| She, however, did not bestow a single glance upon him. | 0.000 | 0.000 | 0.891 | 
Settings used:
{'task': 'tts', 'modality': 'nar-len', 'max_steps': 50, 'max_levels': 7, 'max_duration': 900, 'ar_temperature': 1.0, 'nar_temperature': 0.0, 'min_ar_temperature': -1.0, 'min_nar_temperature': -1.0, 'top_p': 1.0, 'top_k': 0, 'top_no': 0.0, 'min_p': 0.0, 'repetition_penalty': 1.0, 'repetition_penalty_decay': 0.0, 'length_penalty': 0.0, 'beam_width': 0, 'mirostat_tau': 0, 'mirostat_eta': 0, 'dry_multiplier': 0, 'dry_base': 1.75, 'dry_allowed_length': 2, 'input_prompt_length': 0.0, 'input_prompt_prefix': False, 'prefix_silence': 0.0, 'cfg_strength': 4.0, 'cfg_rescale': 0.75, 'seed': 1733981492, 'tqdm': True, 'batch_size': 16}
		Average WER: 0.189
Average CER: 0.116
Average SIM-O: 0.938
| Text | WER↓ | CER↓ | SIM-O↑ | Prompt | Our VALL-E | Ground Truth | 
|---|---|---|---|---|---|---|
| Dann sieht man noch ein paar Meisterfiguren, ein paar NPCs. | 0.100 | 0.071 | 0.969 | |||
| Das ist wieder eine wirklich wichtige Frage, damit du feststellen kannst, ob der Job auch wirklich der Richtige für dich ist. | 0.048 | 0.086 | 0.945 | |||
| Aber wenn der Teigewurz jetzt guckt, dann wird's auf jeden Fall abkratzen. | 0.167 | 0.037 | 0.934 | |||
| Muss ich aufpassen, schon zwei Fails, aber gleich hab ich den Rekord. Der zählt noch. | 0.467 | 0.367 | 0.926 | |||
| Ich hoffe mal, es geht durch simples Neigen auch. Ja, geht es. Ich hab mich schon treffen lassen, wie blöd. | 0.350 | 0.266 | 0.871 | |||
| ... aus dieser Toxicität hätte haben können. | 0.167 | 0.333 | 0.980 | |||
| In der letzten Lektion hatten wir die Zahlen von 0 bis 20. | 0.000 | 0.000 | 0.961 | |||
| Das Material ist da, das Dach ist da und das Seitenteil ist auch da. | 0.143 | 0.052 | 0.934 | |||
| Ja, und wie finden wir jetzt aber raus, ähm, auf welche horizontale Position das kommt? | 0.267 | 0.155 | 0.953 | |||
| Machen wir erstmal unser Werkstück richtig fest. Dafür habe ich hier schon einen Schraubzwinger angebracht. Und die zweite setzen wir jetzt hier an. | 0.304 | 0.143 | 0.848 | |||
| Dass es irgendwann, ähm, funktionieren wird. | 0.167 | 0.106 | 0.941 | |||
| BIRDS heißt der Clip, der in der Animationsszene begeisterte Kommentare erntet. | 0.091 | 0.079 | 0.922 | |||
| Wir sind zurück beim Check 24 Doppelpass und kümmern uns erst mal um die Frage der Wochenauer. | 0.056 | 0.034 | 0.953 | |||
| Falsche Politik, schlechte Politik, verschwendungssüchtige Politik zu alimentieren. | 0.000 | 0.000 | 0.949 | |||
| Sommer- und Weihnachtskonzerte in Güstrow und Wützow sind natürlich auch Tradition. | 0.273 | 0.086 | 0.973 | |||
| Kann das auch positiv geben und das Geld soll doch nicht auch zurück, das soll nicht verbaut oder verbastelt werden. Aber ich sag meistens ja so, | 0.077 | 0.068 | 0.898 | |||
| Die Schule selber durch den Denkmalschutz scheint mir in den Kosten dann auch nochmal einen Sprung mehr zu machen. | 0.368 | 0.286 | 0.980 | |||
| Martin Kutschke übernimmt dann ihr Amt in der Anlage Immergrün und wird jetzt schon mal von ihr eingearbeitet. | 0.222 | 0.083 | 0.918 | |||
| Und wenn Sie 600 Quadratmeter Rasen haben, dann gehören Sie ja fast schon in der Innenstadt zum Großgrundbesitz. | 0.056 | 0.067 | 0.918 | |||
| Weil, ähm, ich einfach sehe, dass die Kunden mit dem Produkt nicht zufrieden sind. Und das wollen wir natürlich nicht. | 0.250 | 0.121 | 0.973 | |||
| Die Rede oder der Ausdruck da von Herrn Söder, wir seien einem Lockdown sehr nah. | 0.333 | 0.089 | 0.926 | |||
| Mein Herz schlägt ruhig und gleichmäßig. | 0.333 | 0.182 | 0.934 | |||
| Nach dem Fermentieren kommen die Tofoblöcke in den Kühlschrank. | 0.111 | 0.015 | 0.938 | |||
| Der Spieler und der Trainer, äh, ne Einladung zustimmen. Und Mats? | 0.273 | 0.129 | 0.949 | |||
| Und die könnte man zu einer kleinen Stadtrundfahrt nutzen. | 0.111 | 0.097 | 0.988 | |||
| Und dann die Dame aus der Personalabteilung. Also sehr geehrter, jetzt hatten wir ja den Titel dabei, sehr geehrter Herr Doktor Müller. | 0.182 | 0.187 | 0.898 | |||
| Macht es gut, Kinder. Wenn es funktioniert, werdet ihr mir noch nachholen. | 0.000 | 0.000 | 0.973 | |||
| Hat die besten aus Deutschland. Die verlieren 6-0. | 0.375 | 0.200 | 0.965 | |||
| Und da kommt die K-Frage Kroos, ja oder nein, auch ins Spiel. Ist er der Mensch? | 0.125 | 0.070 | 0.914 | |||
| Bitte? Sitze im Garten, lese meine Zeitung, geht's Telefon Polizei. | 0.400 | 0.100 | 0.934 | |||
| Das ist jetzt schon fieser, aber ich hab weit geworfen und... | 0.000 | 0.000 | 0.914 | |||
| Und, ähm, hat gemeint, das machen wir doch mal zu einem Spiel und legen das der Konsole bei. | 0.222 | 0.218 | 0.922 | 
Settings used:
{'task': 'tts', 'modality': 'nar-len', 'max_steps': 50, 'max_levels': 7, 'max_duration': 900, 'ar_temperature': 1.0, 'nar_temperature': 0.0, 'min_ar_temperature': -1.0, 'min_nar_temperature': -1.0, 'top_p': 1.0, 'top_k': 0, 'top_no': 0.0, 'min_p': 0.0, 'repetition_penalty': 1.0, 'repetition_penalty_decay': 0.0, 'length_penalty': 0.0, 'beam_width': 0, 'mirostat_tau': 0, 'mirostat_eta': 0, 'dry_multiplier': 0, 'dry_base': 1.75, 'dry_allowed_length': 2, 'input_prompt_length': 0.0, 'input_prompt_prefix': False, 'prefix_silence': 0.0, 'cfg_strength': 4.0, 'cfg_rescale': 0.75, 'seed': 1734033782, 'tqdm': True, 'batch_size': 16}
		Average WER: 0.206
Average CER: 0.117
Average SIM-O: 0.910
| Text | WER↓ | CER↓ | SIM-O↑ | Prompt | Our VALL-E | Ground Truth | 
|---|---|---|---|---|---|---|
| des transports publics de Morges-Bierre-Cossonnet qui sont basés à Morges. | 0.500 | 0.185 | 0.973 | |||
| Et vendredi à l'Elysée, les deux hommes, je vous ai payé compter président du Conseil Italien et Emmanuel Macron, | 0.211 | 0.168 | 0.965 | |||
| La paillette est inspirée. Bonne nouvelle pour les Marseillais. | 0.111 | 0.020 | 0.895 | |||
| Oui, je veux du blédin dans la vie! Hein? Oui, je veux du blédin dans la vie! De quoi tu parles? | 0.333 | 0.344 | 0.918 | |||
| C'est toi qui conduis ? La matelas, Tom, bref, rien a changé par ici. | 0.538 | 0.309 | 0.707 | |||
| Et aujourd'hui, je suis enfin mariée. | 0.000 | 0.000 | 0.906 | |||
| Vous connaissez ce dehors-derans les filles, n'est-ce pas ? Tu sais celui que tu mets quand tu lèves le bras, tu entends. | 0.143 | 0.141 | 0.754 | |||
| Aujourd'hui, nous avons basculé dans une nouvelle ère climatique. Regardez simplement depuis l'été. | 0.231 | 0.157 | 0.957 | |||
| Tirez à 250 000 exemplaires son nouveau roman intitulé Cher Connard | 0.250 | 0.065 | 0.973 | |||
| Oui c'est très étonnant, en allant à la FNAC j'ai vu qu'au rayon Histoire Sociologie, il est numéro 1. | 0.105 | 0.061 | 0.934 | |||
| On espère que l'équipe de France va passer cette étape-là. | 0.300 | 0.113 | 0.699 | |||
| Coq et renard, et nous allons l'utiliser au mieux pour atteindre notre objectif qui est d'avoir 3 oeufs. Alors. | 0.158 | 0.112 | 0.949 | |||
| Trump français avait promis il y a un an de couvrir 100% des TGV d'ici 2018 en 4G. | 0.286 | 0.130 | 0.973 | |||
| Je travaille pas mal sur la nuit, enfin mon travail prend encore la nuit. | 0.786 | 0.595 | 0.957 | |||
| Oui, signalons tout de même que les huit soldats de la CMA ont fini par être relâchés. | 0.353 | 0.205 | 0.969 | |||
| Une pelleteuse. Un camion-benne. | 0.750 | 0.125 | 0.898 | |||
| Mais comme c'était un enfant intelligent, eh ben les professeurs ne s'en sont pas rendus compte. Sa mère pensait simplement qu'il était rêveur. | 0.565 | 0.383 | 0.992 | |||
| Invité sur le plateau, Vincent Moscato semble voir d'un mauvais œil ce nouveau buzz autour de l'émission. | 0.059 | 0.018 | 0.973 | |||
| Une fois que j'ai vérifié chacun de mes pyramides, eh bien, mon adversaire va faire exactement la même chose. | 0.158 | 0.133 | 0.980 | |||
| Voilà, vous savez presque tout sur Batman Infiltration. Maintenant, à vous de jouer, et à bientôt sur ce qu'on va faire. | 0.000 | 0.000 | 0.938 | |||
| Quand ce moteur est en pleine charge, c'est là où il avale le plus de choses difficiles à gérer. | 0.053 | 0.068 | 0.938 | |||
| Si, il faut être un minimum doué, mais... | 0.000 | 0.000 | 0.930 | |||
| Donc ça nous oblige à chercher du vocabulaire et de nouvelles structures. | 0.083 | 0.045 | 0.926 | |||
| Depuis les révélations, sa tournée a été modifiée avec des annulations de représentations prévues en janvier et février. | 0.000 | 0.000 | 0.965 | |||
| Nous aider à être heureux. | 0.000 | 0.000 | 0.922 | |||
| La première, c'est une théorie qui concerne la Lune. | 0.000 | 0.000 | 0.957 | |||
| Check. Souffrir un bon coup et se faire décapiter par un gentil assistant attentionné. | 0.000 | 0.000 | 0.828 | |||
| Même nos propres voitures seraient autonomes. | 0.000 | 0.000 | 0.941 | |||
| Nous serions très heureux de vous rencontrer et de vivre des moments forts avec le Seigneur. | 0.000 | 0.000 | 0.832 | |||
| On s'entend de, de mieux en mieux. Voilà, on se connaît, on se connaît beaucoup plus aussi. | 0.353 | 0.296 | 0.934 | |||
| Mbappé passeur, Neymar buteur, les rôles s'inversent dans le temps additionnel. | 0.273 | 0.057 | 0.938 | |||
| Et l'efficacité avec cette magnifique diagonale transversale pour l'Hirola. | 0.000 | 0.000 | 0.711 | 
Settings used:
{'task': 'tts', 'modality': 'nar-len', 'max_steps': 50, 'max_levels': 7, 'max_duration': 900, 'ar_temperature': 1.0, 'nar_temperature': 0.0, 'min_ar_temperature': -1.0, 'min_nar_temperature': -1.0, 'top_p': 1.0, 'top_k': 0, 'top_no': 0.0, 'min_p': 0.0, 'repetition_penalty': 1.0, 'repetition_penalty_decay': 0.0, 'length_penalty': 0.0, 'beam_width': 0, 'mirostat_tau': 0, 'mirostat_eta': 0, 'dry_multiplier': 0, 'dry_base': 1.75, 'dry_allowed_length': 2, 'input_prompt_length': 0.0, 'input_prompt_prefix': False, 'prefix_silence': 0.0, 'cfg_strength': 4.0, 'cfg_rescale': 0.75, 'seed': 1734034471, 'tqdm': True, 'batch_size': 16}
		Average WER: 1.510
Average CER: 0.856
Average SIM-O: 0.888
| Text | WER↓ | CER↓ | SIM-O↑ | Prompt | Our VALL-E | Original VALL-E | Ground Truth | 
|---|
| Text | WER↓ | CER↓ | SIM-O↑ | Prompt | Our VALL-E | Ground Truth | 
|---|---|---|---|---|---|---|
| 一時の方言ニュース、琉球新報の記事から、うんぬきやびだ。 | 4.000 | 0.472 | 0.906 | |||
| そうですね、年末少しね、あの、迷惑かけてますので、まぁ、ここはしっかりと。 | 1.000 | 0.221 | 0.910 | |||
| ゴール式やべぇこいつ。もう一回触れる。 | 1.000 | 0.407 | 0.672 | |||
| なんせ月経祭は毎年50万人が訪れるお化けイベント。 | 0.250 | 0.053 | 0.949 | |||
| いなくなっていた気づいた時には弟と二人だった | 1.000 | 0.362 | 0.938 | |||
| めくらましだったなんて。そんなの納得できるわけない。 | 1.000 | 0.029 | 0.879 | |||
| 目的地がはっきりしたのはいいけど、結構距離あるよな。 | 1.000 | 0.211 | 0.840 | |||
| 最強の敵と戦うためには、俺以外に最強が存在しちゃいけねぇ。 | 1.000 | 0.184 | 0.844 | |||
| 相手に返す技の速度や圧力を調整して狂わせてる。 | 0.000 | 0.000 | 0.930 | |||
| ハサウェイ、ハサウェイ、ガオダーダ、ガオダーダ、ハサウェイ! | 1.000 | 0.212 | 0.832 | |||
| ねえ、ガチウェンローなんだが、超ウェンローなんだが、シェイシェイ。 | 6.722 | 3.057 | 0.969 | |||
| ないな。なんかないなないなないなないな。 | 2.000 | 15.368 | 0.855 | |||
| あの、まぁ、こっからさ、この文章から、あの、実際に現場が決めるんだと思いますけれども、まぁ一応、 | 1.000 | 0.365 | 0.777 | |||
| 舐めるなよ、ドライヌども。 | 1.000 | 0.121 | 0.844 | |||
| 償いない影を背負って | 1.000 | 0.171 | 0.926 | |||
| どこ来いま?あ、僕いた。 | 3.000 | 0.654 | 0.953 | |||
| セクシーので混ざるどんな意図せもあなたに会いにく | 2.000 | 0.032 | 0.953 | |||
| 最高。えぇー、そんなもないわ。 | 1.000 | 0.906 | 0.969 | |||
| やかましい女!やかましい! | 1.000 | 0.464 | 0.895 | |||
| ムズッ。じゃあ次レア客が来たら開くか。 | 1.000 | 0.547 | 0.801 | |||
| おうら、ねえ。メソッチ?こんばんは、え? | 1.000 | 0.947 | 0.961 | |||
| まぁ確かにね。何ですか、サポートって。 | 0.000 | 0.000 | 0.828 | |||
| セミも食べる!ラーメンも食べる!おい! | 1.000 | 0.091 | 0.918 | |||
| 日本でも衆議院と参議院をある党に | 3.000 | 0.434 | 0.941 | |||
| ロックさん、シェイシェイシェイリーユー。抱きまくら。 | 4.000 | 0.510 | 0.875 | |||
| そのー、なんかちょっとデカめな虫もお前らの中にいるんじゃねーの? | 2.000 | 0.369 | 0.934 | |||
| おい、誰だ?ピザにサバを乗せたやつ。 | 0.000 | 0.000 | 0.883 | |||
| ほんとに森ですね。高鳥山トレッキングコースですね、これ。 | 2.000 | 0.107 | 0.707 | |||
| 新型コロナが蔓延してから3度目となる秋の観光シーズンを迎えます。 | 1.000 | 0.154 | 0.949 | |||
| 俺は二度とジュンとあいつの母親を会わせるつもりはないし会ってほしくもない。 | 1.000 | 0.231 | 0.914 | |||
| うわ、ジール剣強っ。0と720。勝った150倍海洋剣じゃん。 | 1.364 | 0.573 | 0.914 | |||
| あぁ、やっと来た。さぁ、さすがに年末カット割ろう。行くよ。 | 1.000 | 0.125 | 0.949 | 
Settings used:
{'task': 'tts', 'modality': 'nar-len', 'max_steps': 50, 'max_levels': 7, 'max_duration': 900, 'ar_temperature': 1.0, 'nar_temperature': 0.0, 'min_ar_temperature': -1.0, 'min_nar_temperature': -1.0, 'top_p': 1.0, 'top_k': 0, 'top_no': 0.0, 'min_p': 0.0, 'repetition_penalty': 1.0, 'repetition_penalty_decay': 0.0, 'length_penalty': 0.0, 'beam_width': 0, 'mirostat_tau': 0, 'mirostat_eta': 0, 'dry_multiplier': 0, 'dry_base': 1.75, 'dry_allowed_length': 2, 'input_prompt_length': 0.0, 'input_prompt_prefix': False, 'prefix_silence': 0.0, 'cfg_strength': 4.0, 'cfg_rescale': 0.75, 'seed': 1734034704, 'tqdm': True, 'batch_size': 16}