Comichafte Zeichnung eines Unternehmens-Serverraums mit einer lokalen LLM.

KI Teil 3: Wann sich lokale KI-Modelle für Unter­neh­men lohnen

Im ers­ten Teil der Serie ging es um die KI-Ver­ord­nung und die Frage, was Unter­neh­men beim Ein­satz von KI grund­sätz­lich beach­ten müs­sen. Im zwei­ten Teil stand die Kenn­zeich­nungs­pflicht für KI-Inhalte im Fokus, also die ganz prak­ti­sche Kon­se­quenz dar­aus, wie KI-gene­rierte Inhalte auf Web­sites, in Blogs oder News­let­tern trans­pa­rent gemacht wer­den müs­sen. Im drit­ten Teil geht es nun einen Schritt weiter—weg von der rei­nen Regu­lie­rungs­frage und hin zur stra­te­gi­schen Infra­struk­tur­ent­schei­dung. Denn wer KI im Unter­neh­men nicht nur gele­gent­lich tes­ten, son­dern dau­er­haft, kon­trol­liert und daten­schutz­sen­si­bel ein­set­zen will, lan­det frü­her oder spä­ter bei einer zen­tra­len Frage: Muss es dafür immer die Cloud gro­ßer KI-Anbie­ter sein?

Genau an die­ser Stelle wer­den lokale Large Lan­guage Models span­nend. Sie ver­spre­chen nicht nur mehr Kon­trolle über sen­si­ble Inhalte und per­so­nen­be­zo­gene Daten, son­dern auch ein Stück tech­no­lo­gi­sche Unab­hän­gig­keit von gro­ßen Platt­for­men – somit Auto­no­mie und Resi­li­enz. Und weil gleich­zei­tig sowohl Hard­ware­preise im KI-Umfeld als auch die lang­fris­ti­gen Kos­ten leis­tungs­fä­hi­ger Cloud-KI ten­den­zi­ell stei­gen, wird die Frage nach loka­len KI-Model­len nicht erst irgend­wann interessant—sondern gerade jetzt.

Warum lokale KI-Modelle für Unter­neh­men attrak­tiv sind

Der größte Vor­teil ist die Daten­ho­heit. Wer ein Modell lokal betreibt, ver­ar­bei­tet Ein­ga­ben im eige­nen Ver­ant­wor­tungs­be­reich statt über fremde Cloud-Infra­struk­tu­ren. Das ist vor allem dann rele­vant, wenn es um interne Doku­mente, sen­si­ble Kun­den­in­for­ma­tio­nen wie Ver­träge oder per­so­nen­be­zo­gene Daten wie Bestel­lun­gen aber auch Per­so­nal­in­for­ma­tio­nen geht. Viele KI-Anwen­dungs­fälle, die in der Cloud aus Daten­schutz- oder Com­pli­ance-Grün­den hei­kel – oder von der euro­päi­schen KI-VO gar ver­bo­ten sind, wer­den lokal über­haupt erst (rea­lis­tisch) nutzbar!

Hinzu kommt ein stra­te­gi­scher Aspekt: Unter­neh­men lie­fern ihr Wis­sen, ihre Pro­zesse und ihre Arbeits­weise nicht dau­er­haft an externe KI-Platt­for­men aus. Selbst wenn Anbie­ter zusi­chern, Inhalte nicht all­ge­mein für Trai­nings­zwe­cke zu ver­wen­den, bleibt – abge­se­hen von der Ver­trau­ens­frage – doch eine struk­tu­relle Abhän­gig­keit von deren Infra­struk­tur, Prei­sen und Pro­dukt­po­li­tik. Lokale Modelle schaf­fen hier mehr Sou­ve­rä­ni­tät und redu­zie­ren den Ven­dor Lock-in deutlich.

Was lokal heute mög­lich ist

Tech­nisch ist der Ein­stieg heute wesent­lich ein­fa­cher als noch vor kur­zer Zeit. Mit Tools wie Oll­ama, LM Stu­dio oder das von mir bevor­zugte Open-WebUI las­sen sich leis­tungs­fä­hige Open-Source-Modelle ver­gleichs­weise unkom­pli­ziert lokal betrei­ben, oft sogar ohne tie­fes KI-Spe­zi­al­wis­sen im All­tag. Genau das macht das Thema inzwi­schen auch für klei­nere Unter­neh­men und ambi­tio­nierte Mit­tel­ständ­ler relevant.

Zu den gän­gi­gen lokal nutz­ba­ren Modell­fa­mi­lien gehö­ren Meta’s Llama, das euro­päi­sche Mis­tral, Qwen, Goo­gles Gemma oder Vari­an­ten des chi­ne­si­schen Deep­Seek, das in vie­len euro­päi­schen Unter­neh­men als Cloud-Ver­sion ver­bo­ten ist, auf­grund sei­ner Leis­tungs­fä­hig­keit in einer geschütz­ten loka­len Instal­la­tion aber höchst inter­es­sant wird. Sie errei­chen nicht in jeder Dis­zi­plin das Niveau der stärks­ten pro­prie­tä­ren Cloud-Modelle, sind aber für viele Pra­xis­auf­ga­ben bereits sehr gut geeig­net: Zusam­men­fas­sun­gen, Wis­sens­ab­fra­gen, Text­ent­würfe, Doku­men­ten­ana­lyse oder Trend-Ana­lyse funk­tio­nie­ren damit über­zeu­gend und ste­hen ihren kom­mer­zi­el­len Cou­sins nicht viel nach.

Wo die Gren­zen liegen

Der wich­tigste Nach­teil loka­ler LLMs ist klar: Die abso­lu­ten Spit­zen­mo­delle von Anthro­pic, Google oder Ope­nAI las­sen sich so lei­der nicht lokal betrei­ben. Wer also in jedem Fall auf die der­zeit leis­tungs­stärks­ten Clo­sed-Source-Modelle zugrei­fen will, bleibt auf Cloud-Ange­bote angewiesen.

Für viele Unter­neh­men ist das aller­dings weni­ger pro­ble­ma­tisch, als es zunächst klingt. Im All­tag wird sel­ten das theo­re­tisch beste Modell für jeden Vor­gang benö­tigt. Viel häu­fi­ger geht es um ver­läss­li­che, sichere und wirt­schaft­li­che Unter­stüt­zung in klar abge­grenz­ten Pro­zes­sen. Genau dafür sind lokale Modelle inzwi­schen oft stark genug.

Kos­ten und wirt­schaft­li­che Logik

Cloud-KI wirkt am Anfang güns­tig, weil keine Anfangs­in­ves­ti­tion nötig ist. Mit wach­sen­der Nut­zung ent­steht dar­aus jedoch ein dau­er­haf­ter Kos­ten­block. Rech­net man bei­spiel­haft mit fünf Nut­zern in einem kos­ten­pflich­ti­gen Ein­stei­ger-Tarif zu jeweils 25 Euro pro Monat, ent­ste­hen 1.500 Euro pro Jahr und 7.500 Euro über fünf Jahre. Bei zehn Nut­zern in einem pro­fes­sio­nel­le­ren Team-Tarif zu jeweils 60 Euro pro Monat lie­gen die Kos­ten bereits bei 7.200 Euro pro Jahr bezie­hungs­weise 36.000 Euro über fünf Jahre. Auch das ist noch eher defen­siv gerech­net, denn in vie­len Unter­neh­men kom­men Zusatz­kos­ten durch API-Nut­zung, Pre­mium-Fea­tures oder wei­tere Spe­zi­al­dienste hinzu, zudem ist in den nächs­ten Jah­ren mit einer deut­li­chen Kos­ten­stei­ge­rung bei kom­mer­zi­el­ler Cloud-KI zu rechnen.

Dem gegen­über steht eine lokale High-End-Work­sta­tion oder ein klei­ner dedi­zier­ter KI-Ser­ver: Für ein soli­des Unter­neh­mens­setup kann man grob mit 4.500 bis 6.000 Euro Hard­ware­kos­ten rech­nen (zum Bei­spiel Apple Mac Stu­dio M3 mit 28-Core CPU, 60-Core GPU und 96 GB Spei­cher für der­zeit rund 4.800 Euro). Rech­net man über fünf Jahre zusätz­lich Reser­ven für Ein­rich­tung, Strom, War­tung und klei­nere Upgrades ein, lan­det man rea­lis­tisch in einer Grö­ßen­ord­nung von etwa 7.000 Euro Gesamt­kos­ten. Im klei­ne­ren Fünf-Nut­zer-Sze­na­rio ist das vor allem ein Argu­ment für Daten­schutz und Unab­hän­gig­keit. Im pro­fes­sio­nel­len Team-Sze­na­rio mit zehn Nut­zern kann sich ein loka­les Setup wirt­schaft­lich sehr deut­lich auszahlen.

Diagramm mit der Kostenentwickling von Einsteiger- und Profi Cloud-KI im Vergleich zu einer lokalen KI.

Warum frü­her ein­stei­gen sinn­voll ist

Gerade jetzt spricht viel dafür, das Thema nicht auf die lange Bank zu schie­ben. Ein Risiko liegt bereits in den rasant stei­gen­den Hard­ware­kos­ten im KI-Umfeld. Leis­tungs­fä­hige GPUs, geeig­nete Work­sta­tions und spe­zia­li­sierte AI-Hard­ware sind schon heute teu­rer und knap­per als noch vor kur­zer Zeit. Wer erst dann reagiert, wenn lokale KI im Markt end­gül­tig Stan­dard gewor­den ist, kauft vor­aus­sicht­lich in einem noch ange­spann­te­ren Preis­um­feld ein.

Gleich­zei­tig ist sehr wahr­schein­lich, dass auch die Kos­ten für leis­tungs­fä­hige Cloud-KI wei­ter stei­gen oder sich zumin­dest stär­ker dif­fe­ren­zie­ren. Der Res­sour­cen­be­darf moder­ner Modelle wächst, hoch­wer­tige Funk­tio­nen wan­dern zuneh­mend in teu­rere Tarife, die Cloud-Anbie­ter wer­den sich kon­so­li­die­ren und müs­sen pro­fi­ta­bel wer­den, gleich­zei­tig gewöh­nen sich Unter­neh­men gerade erst daran, KI breit in Pro­zesse ein­zu­bauen. Genau dar­aus ent­steht ein klas­si­scher Lock-in-Effekt: Wer zu spät beginnt, baut erst ope­ra­tive Abhän­gig­keit auf und opti­miert dann in ein Umfeld hin­ein, in dem sowohl Hard­ware als auch Cloud-Nut­zung teu­rer gewor­den sind.

Des­halb ist der frü­here Ein­stieg stra­te­gisch oft klü­ger als der spä­tere. Nicht zwin­gend als voll­stän­di­ger Ersatz für Cloud-KI, aber als bewuss­ter Auf­bau eige­ner Hand­lungs­fä­hig­keit. Unter­neh­men, die jetzt Erfah­run­gen mit loka­len LLMs sam­meln, schaf­fen Know-how, sichern sich Optio­nen und redu­zie­ren künf­tige Kos­ten- und Abhän­gig­keits­ri­si­ken, bevor diese voll durchschlagen.

Fazit

Lokale LLMs sind heute keine Nischen­lö­sung mehr, son­dern eine rea­lis­ti­sche Alter­na­tive zur kom­mer­zi­el­len Cloud-KI—besonders dort, wo Daten­ho­heit, Daten­schutz, plan­bare Kos­ten und tech­no­lo­gi­sche Unab­hän­gig­keit zäh­len. Sie erset­zen nicht in jedem Fall die Top-Modelle von Ope­nAI oder Anthro­pic, aber sie decken bereits viele betrieb­li­che Anwen­dungs­fälle über­zeu­gend ab.

Der ent­schei­dende Punkt ist des­halb nicht, ob lokale Modelle in jedem Bench­mark die Spitze errei­chen. Ent­schei­dend ist, dass sie Unter­neh­men heute schon eine kon­trol­lier­bare, wirt­schaft­lich sinn­volle und stra­te­gisch kluge Option bie­ten. Und genau, weil Hard­ware ten­den­zi­ell teu­rer wird und Cloud-KI mit hoher Wahr­schein­lich­keit eben­falls, spricht vie­les dafür, eher frü­her als spä­ter einzusteigen.

Über die Autor:in

Michael Keukert - Geschäftsführung

Michael Keu­kert

Michael Keu­kert ver­ant­wor­tet als Geschäfts­füh­rer den bera­ten­den und stra­te­gi­schen Teil. Bereits seit 1993 ist er im damals noch jun­gen Online­mar­ke­ting tätig, 2011 wech­selte er auf Agen­tur­seite zu AIX­hi­bit. Er ist Fach­buch­au­tor und Spre­cher auf Kon­fe­ren­zen, zudem gilt er als einer der füh­ren­den Mailchimp-Exper­ten weltweit.