Überspringen Sie zu Inhalten
Thor News

Thor News

The Hub Of Relevance for Tech & Gaming

Primäres Menü
  • Tech
    • Enterprise-Tech
    • Markt/Politik
  • Gaming
    • Hardware
      • Nintendo
      • PlayStation 5
      • PlayStation 6
      • Handheld
    • Spiele
  • Hardware
    • Notebook
    • CPU
    • GPU
    • Festplatten
    • NVMe
  • Künstliche Intelligenz
  • Gadgets & Devices
    • Apple
    • Android
  • Wissenschaft
    • Astronomie
  • Developers
  • Entertainment
Hell/dunkler Knopf
  • Heim
  • Künstliche Intelligenz
  • Samsung TRM: Kleines Modell schlägt große LLMs
  • Künstliche Intelligenz

Samsung TRM: Kleines Modell schlägt große LLMs

10.10.2025, 16:12 Uhr 3 minutes read
samsung_llm

Samsung-Forscherin Alexia Jolicoeur-Martineau stellt ein neues, tiny rekursives Modell namens TRM (Tiny Recursive Model) vor, das bei strukturierten Logikaufgaben wie Sudoku, Labyrinthen und dem ARC-AGI-Benchmark überraschend gut abschneidet. Im Unterschied zu allgemeinen großen Sprachmodellen (LLMs) wurde TRM speziell für rekursives, schrittweises Problemlösen entworfen und kommt mit nur rund 7 Millionen Parametern aus — tausend- bis millionenfach weniger als moderne Giganten wie Gemini 2.5 Pro.

Inhaltsverzeichnis

Toggle
  • Wie funktioniert das Tiny Recursive Model (TRM)?
  • Leistung: Wie gut ist das Modell wirklich?
  • Warum ist das wichtig für KI-Forschung und Praxis?
  • Limitationen und offene Fragen
  • Was heißt das für Anwender und Entwickler?
  • Quellen

Wie funktioniert das Tiny Recursive Model (TRM)?

Statt die Leistung allein durch enorme Modellgröße zu erzwingen, nutzt TRM eine rekursive Architektur: Das Modell erzeugt zunächst einen Entwurf der Lösung, legt eine interne “Notizfläche” (Scratchpad) an und verbessert diese Antwort iterativ — bis zu mehreren Durchläufen (Recursions). Diese Herangehensweise ähnelt einer inneren Prüf- und Korrekturschleife und ermöglicht es dem kleinen Netzwerk, komplexe, mehrstufige Schlussfolgerungen zu bilden, ohne Milliarden von Parametern zu benötigen. Die technische Beschreibung und Experimente sind in der veröffentlichten Arbeit dokumentiert; die Autorin erklärt Varianten wie HRM (Hierarchical Reasoning Model) und die vereinfachte TRM-Variante.

Leistung: Wie gut ist das Modell wirklich?

Die Ergebnisse sind beeindruckend, aber kontextabhängig: TRM erzielt laut Paper höhere Testwerte auf speziellen Benchmarks — etwa starke Trefferquoten bei extremen Sudoku-Instanzen und bessere Genauigkeit auf Teilen des ARC-AGI-Benchmarks — und übertrifft damit in diesen Aufgaben selbst sehr große LLMs wie DeepSeek-R1, o3-mini und Gemini 2.5 Pro. Wichtig ist: Diese Überlegenheit gilt für eng definierte, strukturierte Rätselaufgaben, nicht für allgemeine Sprach- oder Wissensaufgaben. Die Autorin berichtet von Test-Accuracies wie etwa ~45% auf ARC-AGI-1 für ein 7M-Modell, was für diese Benchmark beachtlich ist.

Warum ist das wichtig für KI-Forschung und Praxis?

Die Arbeit unterstreicht zwei zentrale Punkte: Erstens kann Architektur-Innovation Skalierung ersetzen — gut designte kleine Modelle können bei klar umrissenen Problemen effizienter sein als große, universelle LLMs. Zweitens eröffnet das Potenzial für ressourcenschonende KI: Geräte am Rand (Edge), eingebettete Systeme oder mobile Anwendungen profitieren von Modellen mit geringem Speicher- und Rechenbedarf. Dennoch warnt die Forschung davor, die Ergebnisse zu überdehnen: TRM ist spezialisiert, und seine Stärken können sich außerhalb der getesteten Aufgaben schnell relativieren.

Limitationen und offene Fragen

Mehrere Fachkommentare betonen, dass die Beobachtungen kein allgemeiner Beweis sind, dass kleine Modelle große ersetzen können. Kritikpunkte: mögliche Überanpassung an Testsets, begrenzte Generalisierung auf andere Domänen, und die Tatsache, dass Rekursion und Scratchpad-Mechaniken in größerem Maßstab anders skalieren können. Außerdem sind manche Vergleichsbedingungen (z. B. Feinabstimmung, Prompting, interne Adapter) wichtig für faire Benchmarks. Die Arbeit zeigt zwar ein kraftvolles Konzept, doch seine praktische Reichweite bleibt noch zu prüfen.

Was heißt das für Anwender und Entwickler?

Für Entwickler bedeutet TRM: Überlege, ob dein Problem stark strukturierte, iterative Lösungsschritte erlaubt — dann könnte ein spezialisiertes, kleines Modell deutlich kosteneffizienter sein. Für Forschung und Industrie eröffnet die Studie Wege, wie begrenzte Rechenressourcen sinnvoll eingesetzt werden. Für Endnutzer könnte das in Zukunft bedeuten, dass intelligente Funktionen lokal, offline und energieeffizient möglich werden — etwa bei mobilen Spielen, Assistenzsystemen oder IoT-Geräten. Gleichzeitig bleibt Vorsicht geboten: Allgemeine Aufgaben, kreatives Schreiben oder breit gefächerte Frage-Antwort-Systeme benötigen nach wie vor umfangreiche, vielseitige Modelle.

Keine Produkte gefunden.

Quellen

  • Less is More: Recursive Reasoning with Tiny Networks — A. Jolicoeur-Martineau (arXiv, 2025-10-08)
  • Tiny Samsung AI beats giant LLMs at puzzles — CyberNews (2025-10-09)
  • Samsung AI research team builds a tiny model with big power — Forbes (2025-10-09)

Über den Autor

Avatar-Foto

Sebastian Schiebort

Administrator

Alle Beiträge anzeigen

Letzte Aktualisierung am 4.02.2026 / Affiliate Links / Bilder von der Amazon Product Advertising API. Alle hier angezeigten Preise und Verfügbarkeiten gelten zum angegebenen Zeitpunkt der Einbindung und können sich jederzeit ändern. Der Preis und die Verfügbarkeit, die zum Kaufzeitpunkt auf Amazon.de angezeigt werden, sind maßgeblich. Als Amazon-Partner verdienen wir an qualifizierten Verkäufen.

Keine ähnlichen Artikel gefunden.

  • Künstliche Intelligenz

Post navigation

Previous: Kleinster Quantencomputer: Ein Photon, 32 Dimensionen
Next: Oracle: 50.000 AMD AI-Chips gegen Nvidia

Andere Beiträge des Autors

Commodore 128: CES-Premiere 1985, Technik und Vermächtnis Commodore 128 CES-Premiere 1985, Technik und Vermächtnis

Commodore 128: CES-Premiere 1985, Technik und Vermächtnis

06.01.2026, 03:40 Uhr 0
GlassWorm Malware: neue Mac-Welle mit Krypto-Trojanern GlassWorm Malware neue Mac-Welle mit Krypto-Trojanern

GlassWorm Malware: neue Mac-Welle mit Krypto-Trojanern

04.01.2026, 19:51 Uhr 0
Nano Banana 2 Flash: Googles schnellste Bild-KI 2026 Nano Banana 2 Flash Googles schnellste Bild-KI 2026

Nano Banana 2 Flash: Googles schnellste Bild-KI 2026

02.01.2026, 18:14 Uhr 0
ChatGPT-Hardware: OpenAI setzt auf Stimme & Emotion ChatGPT-Hardware OpenAI setzt auf Stimme Emotion

ChatGPT-Hardware: OpenAI setzt auf Stimme & Emotion

01.01.2026, 18:22 Uhr 0

Ähnliche Themen

Nano Banana 2 Flash Googles schnellste Bild-KI 2026
5 minutes read
  • Künstliche Intelligenz

Nano Banana 2 Flash: Googles schnellste Bild-KI 2026

02.01.2026, 18:14 Uhr 0
ChatGPT-Hardware OpenAI setzt auf Stimme Emotion
6 minutes read
  • Künstliche Intelligenz

ChatGPT-Hardware: OpenAI setzt auf Stimme & Emotion

01.01.2026, 18:22 Uhr 0
KI-Gigafactory München 1 Mrd. Euro & GPU-Vergleich
6 minutes read
  • Künstliche Intelligenz

KI-Gigafactory München: 1 Mrd. Euro für AI-Cloud

04.11.2025, 19:26 Uhr 0
Google bestätigt Ads in der AI-Suche – aber anders
5 minutes read
  • Künstliche Intelligenz

Google bestätigt: Ads in der AI-Suche – aber anders

02.11.2025, 02:12 Uhr 0
Über eine Million Nutzer pro Woche OpenAI offenbart Suizid-Gefährdung bei ChatGPT-Chats
4 minutes read
  • Künstliche Intelligenz

Über eine Million Nutzer pro Woche: OpenAI offenbart Suizid-Gefährdung bei ChatGPT-Chats

28.10.2025, 19:25 Uhr 0
Hochpräzises Küstenflut-Modelling University of California Santa Cruz mit NVIDIA-Technologie
4 minutes read
  • Künstliche Intelligenz
  • GPU

UCSC & NVIDIA: GPU-Technologie revolutioniert Küstenflut-Modelle

22.10.2025, 13:26 Uhr 0

Trends

Bald kein Prime-Sharing mehr – droht das auch in Deutschland? amazon_prime_stop 1

Bald kein Prime-Sharing mehr – droht das auch in Deutschland?

09.09.2025, 09:01 Uhr 0
Gaming Notebook mit Nvidia RTX 5090 – Razer Blade 18 Razer_RTX5090_Notebook 2

Gaming Notebook mit Nvidia RTX 5090 – Razer Blade 18

30.08.2025, 19:07 Uhr 0
Dying Light: The Beast uncut in Deutschland: So geht’s Dying Light The Beast 3

Dying Light: The Beast uncut in Deutschland: So geht’s

19.09.2025, 10:49 Uhr 0
Dying Light: The Beast – Neuer Trailer zeigt Mortal-Kombat-Brutalität Dying Light The Beast 4

Dying Light: The Beast – Neuer Trailer zeigt Mortal-Kombat-Brutalität

05.08.2025, 18:44 Uhr 0

Neueste Beiträge

  • Commodore 128: CES-Premiere 1985, Technik und Vermächtnis
  • GlassWorm Malware: neue Mac-Welle mit Krypto-Trojanern
  • Nano Banana 2 Flash: Googles schnellste Bild-KI 2026
  • ChatGPT-Hardware: OpenAI setzt auf Stimme & Emotion
  • Fractal Design Scape Headset Review: Mein Fazit

Neueste Kommentare

Es sind keine Kommentare vorhanden.

Archiv

  • Januar 2026
  • November 2025
  • Oktober 2025
  • September 2025
  • August 2025
  • Juli 2025

Könnte dich auch interessieren

Commodore 128 CES-Premiere 1985, Technik und Vermächtnis
6 minutes read
  • Retrogaming

Commodore 128: CES-Premiere 1985, Technik und Vermächtnis

06.01.2026, 03:40 Uhr 0
GlassWorm Malware neue Mac-Welle mit Krypto-Trojanern
6 minutes read
  • Developers
  • Cybersecurity

GlassWorm Malware: neue Mac-Welle mit Krypto-Trojanern

04.01.2026, 19:51 Uhr 0
Nano Banana 2 Flash Googles schnellste Bild-KI 2026
5 minutes read
  • Künstliche Intelligenz

Nano Banana 2 Flash: Googles schnellste Bild-KI 2026

02.01.2026, 18:14 Uhr 0
ChatGPT-Hardware OpenAI setzt auf Stimme Emotion
6 minutes read
  • Künstliche Intelligenz

ChatGPT-Hardware: OpenAI setzt auf Stimme & Emotion

01.01.2026, 18:22 Uhr 0
Cookie-Einstellungen ändern
  • Impressum
  • Datenschutzerklärung
  • Über uns
  • Redaktionelle Richtlinien
  • Kontakt
  • Facebook
  • x.com
  • WhatsApp
  • Flipboard
  • RSS Feed
Alle Rechte vorbehalten. Copyright © thor.news