cnt
Llama 4 ist nur mit Tricks top
Quelle: Depositphotos

Llama 4 ist nur mit Tricks top

Meta setzte in einem Benchmark-Test auf LMarena nicht die offiziell freigegebene Variante von Llama 4 Maverick ein, sondern eine speziell auf Konversation zugeschnittene und erreichte so den zweiten Rang. Die offizielle Version schneidet massiv schlechter ab.
14. April 2025

     

Kürzlich hat Meta die ersten Llama-4-Sprachmodelle freigegeben und die überragende Leistung seiner neuen KI-Modell-Generation in den Vordergrund gestellt ("Swiss IT Magazine" berichtete). So betonte Meta etwa, Llama 4 habe in Tests als zweitbestes Modell nach Googles Gemini 2.5 abgeschnitten.

Jetzt wurde bekannt, dass Meta bei den Tests auf der KI-Benchmark-Plattform LMarena getrickst hat. Zum Einsatz kam nämlich eine speziell getunte Version von Llama 4 Maverick. Meta hat dies inzwischen eingeräumt und neue Tests mit der fürs Publikum freigegebenen Version von Llama 4 Maverick durchgeführt. Und siehe da: Jetzt liegt das Modell auf dem 32. Platz, also weit hinter vielen Konkurrenzmodellen.


Meta entschuldigte sich gemäss "Techcrunch" für die Trickserei mit den Worten: "Llama-4-Maverick-03-26-Experimental ist eine für Chat optimierte Version, mit der wir experimentiert haben und die auf LMarena gut performt." Man wolle nun verfolgen, wie Entwickler die Open-Source-Version Llama-4-Maverick-17B-128E-Instruct auf ihre Use Cases anpassen und sei auf Feedback eingestellt. (ubi)


Weitere Artikel zum Thema

Meta soll bei KI-Benchmark gemogelt haben - Konzern dementiert

8. April 2025 - Meta hat laut Kritikern aus der Community Benchmarks manipuliert, um die Performance von Llama 4 zu schönen. Der Konzern wehrt sich jetzt gegen die Vorwürfe.

Meta beginnt mit der Lancierung von Llama 4

7. April 2025 - Mit den neuen, ab sofort erhältlichen LLMs Llama 4 Scout und Maverick tritt Meta laut eigener Aussage in eine neue Ära nativ multimodaler KI-Innovation ein.

Meta AI startet in Europa

20. März 2025 - Meta lanciert seine KI-Dienste nun auch in Europa. Den Anfang macht ein Chatbot, der in den entsprechenden Apps von Meta implementiert wird. Weitere Features sind geplant, aber noch ohne konkretes Datum.


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Wieviele Fliegen erledigte das tapfere Schneiderlein auf einen Streich?
GOLD SPONSOREN
SPONSOREN & PARTNER