Mistral AI hat Medium 3.5 veröffentlicht — das bislang stärkste Modell eines europäischen Anbieters. Es ist auf Coding und autonome Agenten optimiert, kostet 0,40 Dollar pro Million Input-Tokens und lässt sich auf nur vier GPUs im eigenen Rechenzentrum betreiben. Für Mittelständler, die eine souveräne KI-Alternative suchen, ändert sich damit die Ausgangslage.
Was Mistral wirklich angekündigt hat
Am 29. April stellte das Pariser Unternehmen Mistral AI drei Neuerungen gleichzeitig vor: das Sprachmodell Medium 3.5, einen Remote-Coding-Agent auf der hauseigenen Plattform Vibe und einen neuen „Work Mode" im Chatbot Le Chat. Medium 3.5 erreicht nach Mistrals Angaben rund 90 Prozent der Leistung von Claude Sonnet 4.6 — bei einem Achtel der Kosten.
Konkret: 0,40 Dollar pro Million Input-Tokens und 2 Dollar pro Million Output-Tokens. Zum Vergleich: Claude Sonnet 4.6 kostet 3 Dollar Input und 15 Dollar Output, GPT-5.5 liegt bei 5 beziehungsweise 30 Dollar. Das Modell ist multimodal (Text und Bild), unterstützt Custom Post-Training und läuft auf Mistrals eigener Plattform, Amazon SageMaker sowie demnächst auf Azure, Google Cloud Vertex und IBM WatsonX.
Besonders relevant: Medium 3.5 lässt sich ab vier GPUs auch on-premises betreiben. Damit steht erstmals ein Frontier-nahes Modell bereit, das vollständig im eigenen Rechenzentrum oder in einer europäischen Private Cloud laufen kann.
Warum das für den Mittelstand zählt
Für deutsche Unternehmen mit strengen Datenschutz-Anforderungen war die Modellauswahl bislang überschaubar. Die leistungsfähigsten Modelle kamen von OpenAI und Anthropic — beide US-Anbieter, deren Datenverarbeitung mindestens teilweise über amerikanische Server läuft. Mistral ist ein französisches Unternehmen, das von der EU AI Act-Perspektive als europäischer Anbieter gilt.
Der Preisvorteil ist erheblich. Ein Mittelständler, der täglich rund 500.000 Tokens über eine API verarbeitet, zahlt mit Medium 3.5 etwa 6 Euro im Monat für Input-Tokens. Bei Claude Sonnet 4.6 wären es rund 45 Euro, bei GPT-5.5 rund 75 Euro. Das sind Größenordnungen, bei denen auch kleinere Betriebe experimentieren können, ohne ein Projektbudget zu belasten.
Coding-Agents für interne Entwicklung
Der neue Vibe-Agent kann Remote-Repositories klonen, Code analysieren, Änderungen vorschlagen und Pull Requests erstellen. Für IT-Teams im Mittelstand, die keine eigene ML-Abteilung haben, ist das ein niedrigschwelliger Einstieg in KI-gestützte Softwareentwicklung. In unseren ersten Tests bei ATLAS Consulting liegt die Code-Qualität auf dem Niveau mittlerer US-Modelle — bemerkenswert für einen europäischen Anbieter.
Dokumentenverarbeitung mit Datensouveränität
Wer Verträge, Rechnungen oder Patientendaten verarbeiten muss, steht vor der Frage: Darf ich diese Dokumente an eine US-API senden? Mit Medium 3.5 on-premises entfällt das Problem. Die Daten verlassen nie das eigene Netzwerk. Der Aufwand für die Einrichtung liegt nach Mistrals Angaben bei einem halben Tag für ein erfahrenes DevOps-Team.
Le Chat Work Mode für Fachabteilungen
Der neue Work Mode in Mistrals Chatbot Le Chat richtet sich an Sachbearbeiter und Fachkräfte ohne technisches Vorwissen. Er bündelt Recherche, Zusammenfassung und Aufgabenverwaltung in einer Oberfläche. Für Unternehmen, die ihren Teams einen geschützten KI-Zugang geben wollen, ohne jede Abteilung an ChatGPT anzubinden, ist das eine überlegenswerte Option.
„Die günstigste KI nützt nichts, wenn die Daten dafür nach Übersee müssen. Dass ein europäisches Frontier-Modell jetzt on-premises läuft, ist der eigentliche Durchbruch."
lightbulb
Praxis-Tipp
Testen Sie Medium 3.5 zuerst über die Mistral-API (La Plateforme), bevor Sie in eine On-Premises-Installation investieren. Die API-Kosten sind so gering, dass ein zweiwöchiger Paralleltest mit Ihrem bestehenden Modell praktisch nichts kostet. Erst wenn die Qualität für Ihren Use-Case stimmt, lohnt sich der Aufwand für die lokale Instanz.
Kosten im Vergleich
Die Token-Preise von Medium 3.5 positionieren es deutlich unter den US-Frontier-Modellen. Wichtig dabei: Günstigere Tokens bedeuten nicht automatisch günstigere Ergebnisse. Wenn ein Modell mehr Tokens für dieselbe Aufgabe braucht, relativiert sich der Preisvorteil.
| Modell | Input (pro 1M Tokens) | Output (pro 1M Tokens) |
| Mistral Medium 3.5 | 0,40 $ | 2 $ |
| Claude Sonnet 4.6 | 3 $ | 15 $ |
| GPT-5.5 (Spud) | 5 $ | 30 $ |
| Claude Opus 4.7 | 15 $ | 75 $ |
| Llama 4 Maverick | Open Source | Infrastrukturkosten |
Fazit
Mistral Medium 3.5 ist kein Modell, das die US-Frontier-Anbieter vom Thron stößt. Aber es ist das erste europäische Modell, das nah genug herankommt, um für viele Unternehmens-Anwendungen eine realistische Alternative zu sein — besonders dort, wo Datensouveränität, EU-Compliance oder schlicht niedrige Kosten im Vordergrund stehen.
Für Mittelständler lautet die Empfehlung: Wenn Ihr Use-Case keine absolute Spitzenleistung beim Reasoning erfordert, sondern solide Code-Generierung, Dokumentenverarbeitung oder einen internen Chatbot — dann gehört Medium 3.5 auf Ihre Evaluierungsliste. ATLAS Consulting begleitet Unternehmen bei der Bewertung und Integration europäischer KI-Modelle, von der ersten Analyse bis zum produktiven Betrieb.
Mistral AI has released Medium 3.5 — the strongest model yet from a European provider. It is optimised for coding and agentic tasks, costs 0.40 dollars per million input tokens, and can run on just four GPUs on-premises. For mid-sized companies looking for a sovereign AI alternative, this changes the equation.
What Mistral actually announced
On April 29, the Paris-based company Mistral AI unveiled three products simultaneously: the Medium 3.5 language model, a remote coding agent on its Vibe platform, and a new Work Mode in its Le Chat chatbot. Medium 3.5 reaches roughly 90 percent of Claude Sonnet 4.6 performance according to Mistral — at one eighth of the cost.
Specifically: 0.40 dollars per million input tokens and 2 dollars per million output tokens. For comparison: Claude Sonnet 4.6 costs 3 dollars input and 15 dollars output; GPT-5.5 runs at 5 and 30 dollars respectively. The model is multimodal (text and image), supports custom post-training, and runs on Mistral's own platform, Amazon SageMaker, and soon on Azure, Google Cloud Vertex, and IBM WatsonX.
Particularly relevant: Medium 3.5 can be deployed on-premises with as few as four GPUs. For the first time, a near-frontier model is available that can run entirely in a company's own data centre or a European private cloud.
Why this matters for mid-sized businesses
For German companies with strict data protection requirements, the choice of models has been limited. The most capable models came from OpenAI and Anthropic — both US providers whose data processing runs at least partly through American servers. Mistral is a French company that qualifies as a European provider under the EU AI Act.
The cost advantage is substantial. A mid-sized company processing roughly 500,000 tokens per day via API would pay about 6 euros per month for input tokens with Medium 3.5. With Claude Sonnet 4.6, that figure would be around 45 euros; with GPT-5.5, around 75 euros. These are price ranges where even smaller companies can experiment without straining a project budget.
Coding agents for internal development
The new Vibe agent can clone remote repositories, analyse code, suggest changes, and create pull requests. For IT teams in mid-sized companies that lack a dedicated ML department, this is an accessible entry point into AI-assisted software development. In our initial tests at ATLAS Consulting, code quality is on par with mid-range US models — noteworthy for a European provider.
Document processing with data sovereignty
Anyone who needs to process contracts, invoices, or patient data faces the question: can I send these documents to a US API? With Medium 3.5 on-premises, the problem disappears. Data never leaves the company's own network. According to Mistral, setup takes about half a day for an experienced DevOps team.
Le Chat Work Mode for business teams
The new Work Mode in Mistral's Le Chat chatbot targets knowledge workers without technical expertise. It bundles research, summarisation, and task management in a single interface. For companies that want to give their teams protected AI access without connecting every department to ChatGPT, this is an option worth considering.
"The cheapest AI is useless if your data has to cross the Atlantic for it. A European frontier model running on-premises — that is the real breakthrough."
lightbulb
Practical tip
Test Medium 3.5 via the Mistral API (La Plateforme) first, before investing in an on-premises installation. The API costs are so low that a two-week parallel test alongside your current model costs virtually nothing. Only invest in the local instance once the quality meets your use case requirements.
Cost comparison
Medium 3.5's token pricing positions it well below US frontier models. An important caveat: cheaper tokens do not automatically mean cheaper results. If a model requires more tokens for the same task, the price advantage diminishes.
| Model | Input (per 1M tokens) | Output (per 1M tokens) |
| Mistral Medium 3.5 | $0.40 | $2 |
| Claude Sonnet 4.6 | $3 | $15 |
| GPT-5.5 (Spud) | $5 | $30 |
| Claude Opus 4.7 | $15 | $75 |
| Llama 4 Maverick | Open source | Infrastructure costs |
Conclusion
Mistral Medium 3.5 is not a model that dethrones the US frontier providers. But it is the first European model that comes close enough to serve as a realistic alternative for many enterprise applications — especially where data sovereignty, EU compliance, or simply low costs are the priority.
The recommendation for mid-sized businesses: if your use case does not require absolute top-tier reasoning but rather solid code generation, document processing, or an internal chatbot, then Medium 3.5 belongs on your evaluation list. ATLAS Consulting supports companies in evaluating and integrating European AI models, from the initial analysis through to production deployment.