SubQ 1M: Unterschied zwischen den Versionen
Aus devops.straight8.de
Zur Navigation springenZur Suche springen
(Die Seite wurde neu angelegt: „'''SubQ 1M-Preview''' (von der Firma Subquadratic) ist ein bahnbrechendes Large Language Model (LLM), das im Mai 2026 für Aufsehen sorgt, da es die bisherigen Grenzen der Kontextverarbeitung und Effizienz neu definiert. [[https://www.codiste.com/subq-first-sub-quadratic-frontier-llm-long-context-ai 1], [https://www.reddit.com/r/ArtificialInteligence/comments/1t4nxcd/subq_just_blew_my_mind_12m_token_context_with/ 2]] Hier sind die Besonderheiten im Über…“) |
Keine Bearbeitungszusammenfassung |
||
| Zeile 9: | Zeile 9: | ||
* '''Fokus auf Coding-Agenten:''' Die Fähigkeit, riesige Repositories (statt nur einzelner Dateien) auf einmal zu "verstehen", revolutioniert die Arbeit von KI-Coding-Assistenten. [[https://help.apiyi.com/en/claude-4-6-context-window-1m-token-guide-en.html 1], [https://www.datacamp.com/de/blog/subq-ai-explained 2]] | * '''Fokus auf Coding-Agenten:''' Die Fähigkeit, riesige Repositories (statt nur einzelner Dateien) auf einmal zu "verstehen", revolutioniert die Arbeit von KI-Coding-Assistenten. [[https://help.apiyi.com/en/claude-4-6-context-window-1m-token-guide-en.html 1], [https://www.datacamp.com/de/blog/subq-ai-explained 2]] | ||
* '''Verfügbarkeit:''' Es handelt sich um ein [https://www.facebook.com/nevercodealone/videos/12m-tokens-closed-source-viele-fragen-offen-subq-beta-startet-subq-ki-llm-nca/1609432520116108/ Closed-Source]-Modell, das aktuell (Stand Mai 2026) in einer [https://www.datacamp.com/de/blog/subq-ai-explained privaten Beta-Phase] über die SubQ-Website angefragt werden kann. [[https://www.facebook.com/nevercodealone/videos/12m-tokens-closed-source-viele-fragen-offen-subq-beta-startet-subq-ki-llm-nca/1609432520116108/ 1], [https://www.youtube.com/watch?v=219VyUp854A 2]] | * '''Verfügbarkeit:''' Es handelt sich um ein [https://www.facebook.com/nevercodealone/videos/12m-tokens-closed-source-viele-fragen-offen-subq-beta-startet-subq-ki-llm-nca/1609432520116108/ Closed-Source]-Modell, das aktuell (Stand Mai 2026) in einer [https://www.datacamp.com/de/blog/subq-ai-explained privaten Beta-Phase] über die SubQ-Website angefragt werden kann. [[https://www.facebook.com/nevercodealone/videos/12m-tokens-closed-source-viele-fragen-offen-subq-beta-startet-subq-ki-llm-nca/1609432520116108/ 1], [https://www.youtube.com/watch?v=219VyUp854A 2]] | ||
== Subquadratic (Unternehmen) == | |||
'''Subquadratic''' ist ein KI-Startup mit Sitz in Miami, Florida. [[https://www.linkedin.com/company/subquadratic-ai 1], [https://refreshmiami.com/news/subquadratic-raised-29m-on-the-idea-that-it-has-cracked-ais-biggest-math-problem-now-comes-the-hard-part/ 2]] | |||
Hier sind die wichtigsten Details zum Unternehmen: | |||
* '''Herkunft:''' Es handelt sich um ein in Miami ansässiges Startup, das im Mai 2026 aus dem "Stealth-Modus" (geheime Entwicklung) hervorgetreten ist. [[https://refreshmiami.com/news/subquadratic-raised-29m-on-the-idea-that-it-has-cracked-ais-biggest-math-problem-now-comes-the-hard-part/ 1]] | |||
* '''Fokus:''' Das Unternehmen entwickelt eine neue Klasse von Large Language Models (LLMs). [[https://www.linkedin.com/company/subquadratic-ai 1]] | |||
* '''Technologie:''' Subquadratic konzentriert sich auf eine "subquadratic sparse attention" (SSA)-Architektur, die darauf ausgelegt ist, Rechenaufwand und Kosten im Vergleich zu herkömmlichen Transformern drastisch zu reduzieren, insbesondere bei sehr langen Kontextfenstern (bis zu 12 Millionen Token). [[https://www.datacamp.com/de/blog/subq-ai-explained 1], [https://refreshmiami.com/news/subquadratic-raised-29m-on-the-idea-that-it-has-cracked-ais-biggest-math-problem-now-comes-the-hard-part/ 2]] | |||
* '''Produkte:''' Das Unternehmen bietet mit SubQ Code und SubQ Search KI-Modelle an, die sich derzeit in der privaten Beta-Phase befinden. [[https://www.datacamp.com/de/blog/subq-ai-explained 1]] | |||
== Kurz-Glossar: SubQ & SSA == | == Kurz-Glossar: SubQ & SSA == | ||
Aktuelle Version vom 15. Mai 2026, 14:13 Uhr
SubQ 1M-Preview (von der Firma Subquadratic) ist ein bahnbrechendes Large Language Model (LLM), das im Mai 2026 für Aufsehen sorgt, da es die bisherigen Grenzen der Kontextverarbeitung und Effizienz neu definiert. [1, 2]
Hier sind die Besonderheiten im Überblick:
- 12 Millionen Token Kontextfenster: Das ist extrem groß (etwa 30- bis 60-mal mehr als der Standard von 200k–400k) und entspricht mehreren tausend Büchern oder gigantischen Codebases. [1, 2, 3, 4]
- Subquadratische Sparse Attention (SSA) Architektur: Im Gegensatz zu traditionellen Transformern, deren Rechenaufwand quadratisch (\(O(N^2)\)) mit der Länge des Textes steigt, skaliert SubQ linear oder annähernd linear. Das bedeutet: Verdoppelt sich der Kontext, verdoppelt sich der Rechenaufwand nur (nicht vervierfacht). [1, 2]
- Massive Effizienzsteigerung & Kostenersparnis: Laut Angaben ist SubQ bei 1 Million Tokens bis zu \(52\times\) schneller als FlashAttention und reduziert den Rechenaufwand um das Tausendfache gegenüber bisherigen Top-Modellen. Die Betriebskosten sollen nur bei etwa 1/5 bis 1/20 der Kosten von Modellen wie Claude Opus liegen. [1, 2, 3]
- "Needle in a Haystack"-Spitzenleistung: Das Modell ist auf das Finden spezifischer Informationen in extrem langen Texten spezialisiert (Long-Context-Retrieval) und erreicht in Benchmarks teilweise über 95% RULER-Score. [1]
- Fokus auf Coding-Agenten: Die Fähigkeit, riesige Repositories (statt nur einzelner Dateien) auf einmal zu "verstehen", revolutioniert die Arbeit von KI-Coding-Assistenten. [1, 2]
- Verfügbarkeit: Es handelt sich um ein Closed-Source-Modell, das aktuell (Stand Mai 2026) in einer privaten Beta-Phase über die SubQ-Website angefragt werden kann. [1, 2]
Subquadratic (Unternehmen)[Bearbeiten]
Subquadratic ist ein KI-Startup mit Sitz in Miami, Florida. [1, 2]
Hier sind die wichtigsten Details zum Unternehmen:
- Herkunft: Es handelt sich um ein in Miami ansässiges Startup, das im Mai 2026 aus dem "Stealth-Modus" (geheime Entwicklung) hervorgetreten ist. [1]
- Fokus: Das Unternehmen entwickelt eine neue Klasse von Large Language Models (LLMs). [1]
- Technologie: Subquadratic konzentriert sich auf eine "subquadratic sparse attention" (SSA)-Architektur, die darauf ausgelegt ist, Rechenaufwand und Kosten im Vergleich zu herkömmlichen Transformern drastisch zu reduzieren, insbesondere bei sehr langen Kontextfenstern (bis zu 12 Millionen Token). [1, 2]
- Produkte: Das Unternehmen bietet mit SubQ Code und SubQ Search KI-Modelle an, die sich derzeit in der privaten Beta-Phase befinden. [1]
Kurz-Glossar: SubQ & SSA[Bearbeiten]
- Subquadratisch (Sub-quadratic): Bezeichnet Algorithmen, deren Komplexität langsamer wächst als \(N^{2}\). Dies ist entscheidend, um sehr lange Texte effizient zu verarbeiten, ohne dass der Speicherbedarf explodiert.
- Sparse Attention (Spärliche Aufmerksamkeit): Eine Technik, bei der nicht jedes Wort (Token) mit jedem anderen Wort im Text verglichen wird, sondern nur mit den relevantesten. Dies spart Rechenleistung.
- SSA (Subquadratic Sparse Attention): Die von SubQ verwendete Kernarchitektur, die Spärlichkeit mit effizienter linearer Skalierung verbindet.
- 12M Token Kontextfenster: Die Fähigkeit, bis zu 12 Millionen Einheiten (Token) Text in einer einzigen Anfrage zu lesen, zu verstehen und zu verarbeiten.
- "Needle in a Haystack" (Nadel im Heuhaufen): Ein Benchmark-Test, der prüft, ob ein Modell ein winziges, spezifisches Faktum in einem extrem langen Dokument finden kann.
- Linear Scaling (Lineare Skalierung): Der Rechenaufwand wächst proportional zur Länge der Eingabe (\(O(N)\)), nicht überproportional wie beim alten quadratischen Standard.
- Frontier Model: Ein KI-Modell der neuesten Generation, das an der Leistungsspitze (State-of-the-Art) agiert.
- RAG (Retrieval-Augmented Generation): Ein Prozess, bei dem externe Daten gesucht und dem Modell übergeben werden. Mit extrem langen Kontextfenstern wird dieses "suchen und übergeben" oft überflüssig. [1, 2, 3, 4, 5]
Hinweis: Da sich SubQ 1M-Preview in der Frühphase befindet, werden die Leistungsdaten teilweise noch von externen Nutzern validiert. [1]