Im Gespräch mit Prof. Dr. Frank Schönefeld
Frisch von der TTI/Vanguard Technologiekonferenz in den USA serviert uns KI-Berater Prof. Dr. Frank Schönefeld (ehem. CTO Telekom MMS) die brühwarmen Neuigkeiten zu den Trends rund um die großen KI-basierten Sprachmodelle (LLMs). Fast zwölf Monate nach unserem ersten Gespräch zum Thema generative KI, haben sich die Ereignisse inzwischen überschlagen und das Wettrennen der Tech-Konzerne wird mit Spannung verfolgt. Wie steht es also um die Potenziale der einzelnen Marktteilnehmer und bezüglich der regulatorischen Aspekte? Die Diskussion mit Frank war wieder äußerst aufschlussreich und hat uns eine optimistisch Perspektive auf die Zukunft dieser Technologie geboten.
Die glorreichen Sieben: Der Wettlauf um die KI-Vorreiterschaft und die Kraft von Open Source
Unternehmen wie Alphabet (mit Bard und Gemini vom Google), Amazon (mit Alexa und Olympus) und Microsoft (mit GPT, Q* von OpenAI) sind ganz vorne mit dabei und investieren massiv in die Entwicklung von KI-Modellen. Doch das sind längst nicht die Einzigen. Unter den „glorreichen Sieben“ der führenden US-amerikanischen Tech-Unternehmen ziehen auch Meta mit ihrem Open-Source-Ansatz (Llama) sowie Apple nach. NVIDIA als weltweit führender Anbieter für KI-Computing liefert die inzwischen heißbegehrte und unverzichtbare Hardware. Diese Unternehmen haben einen erheblichen Vorsprung, der schwer einzuholen ist. Die Sprachmodelle sind unfassbar riesig in ihrer Größe und werden auch in verschiedenen Ausführungen und Anwendungen bereitgestellt. Aber auch der chinesische Markt darf nicht aus den Augen verloren werden, mit ERNIE hat Baidu bereits ihren KI-Chatbot in Suche, Kartendienst, Cloud- und Business-Apps integriert.
Die rasante Entwicklung von KI-Modellen wie „Gemini“ von Google verdeutlicht die enormen Fortschritte, die in diesem Bereich in kürzester Zeit erzielt wurden und die eine neue Ära einläuten. Auch Frank betont, dass Gemini in der multimodalen Leistungsfähigkeit führend ist und bereits beeindruckende Ergebnisse erzielt hat. Dabei ist die KI nicht nur auf Sprache beschränkt, sondern verarbeitet ebenso visuellen, akustischen Input wie Videos, Audios und Bilder. Die Bedeutung von multimodalen KIs ist steig am Wachsen. Sehen, Sprechen, Hören, … welche menschlichen Sinne kann eine KI eigentlich nicht bedienen?
Aber ist die Verwendung einer High-End-KI für jeden wirklich notwendig, insbesondere wenn man die erhebliche notwendige Rechenpower für den Betrieb der Anwendungen bedenkt. Gemini wurde daher in drei Varianten klassifiziert: Ultra (für umfassende Anwendungen), Pro (eine kleinere Variante) und Nano (für lokale Geräte, wie Raspberry Pi oder Handys). Die Leistungsfähigkeit von Ultra liegt etwa 20-25% über Pro und 40% über Nano. Die Klassifizierung ermöglicht eine gezielte Anpassung an verschiedene Anwendungen und Endgeräte, wobei Nano kostengünstiger und energieeffizienter ist. Auch Microsoft 365 ist mit dem Launch von Copilot bereits weit bezüglich konkreter Angebote und Lizenzmodelle für ihre Produkte.
In Deutschland zeichnen sich ebenfalls spannende Entwicklungen ab. Unternehmen wie Aleph Alpha, Universitäten wie die LMU München und Forschungseinrichtungen wie das Fraunhofer Institut für Intelligente Analyse- und Informationssysteme (IAIS) arbeiten an eigenen KI-Modellen und tragen zur weiteren Diversifizierung und Spezialisierung des KI-Marktes bei. Die Förderung von Open Source Projekten bspw. basierend auf LLaMA von Meta AI und die Zusammenarbeit mit etablierten Unternehmen treiben ebenfalls KI-Anwendungen in Deutschland voran. Die Frage nach der digitalen Souveränität und der Fähigkeit, KI-Modelle auf europäische Sprachen und Regulierungsbedingungen anzupassen, gewinnt dabei zunehmend an Relevanz.
Intelligenz intelligent nutzen: Chance und Herausforderung zugleich
Hinsichtlich Produktivität profitieren unsere Arbeitsprozesse in verschiedenen Jobbereichen vom KI-Einsatz. Besonders auch in der Softwareentwicklung und im Bereich Test erwartet Frank enorme Fortschritte hinsichtlich der Prozessautomatisierung und Qualitätssicherung. Um hier die besten Ergebnisse zu erhalten ist Prompt Engineering aktuell noch eine sehr gefragte Qualifikation – die sich vielleicht bald auch erübrigt, wenn KI diese auch für unsere Bedarfe maßgeschneidert nach Anweisung generiert. Die Einsatzszenarien werden außerdem für die größten Herausforderungen der Menschheit in der Gesundheitsversorgung bis hin zur Bekämpfung des Klimawandels durchdacht. Es ist spannend zu sehen, wie Unternehmen und Forschungseinrichtungen auf der ganzen Welt daran arbeiten, die Möglichkeiten von KI zu nutzen, um innovative Lösungen für komplexe Probleme zu entwickeln.
In diesem Zusammenhang ist es wichtig, dass die Entwicklung und Anwendung von KI verantwortungsbewusst und nachhaltig vorangetrieben werden. KI muss deshalb im Einklang mit ethischen Standards und gesellschaftlichen Werten arbeiten. Gleichzeitig müssen wir als Gesellschaft offen über die Herausforderungen und Risiken von KI diskutieren, um sicherzustellen, dass wir die Technologie zum Wohle aller einsetzen.
Die Diskussionen über die Regulierung von KI sind von großer Bedeutung, da sie die Grundlage für den verantwortungsvollen Einsatz und die Entwicklung dieser Technologie bilden. Die Betrachtung von KI aus ethischer Perspektive und die Integration von Schutzmechanismen für die Menschenrechte sind entscheidend, um sicherzustellen, dass KI-Systeme die Gesellschaft auf positive Weise unterstützen. In jüngster Zeit gab es im Rahmen der Verhandlungen zum AI Act auf europäischer Ebene Diskussionen über die Regulierung von KI-Anwendungen, die einen risikobasierten Ansatz verfolgen. Dieser Ansatz zielt darauf ab, Anwendungsklassen zu identifizieren, in denen der Einsatz von KI eingeschränkt oder verboten werden sollte, wie beispielsweise bei der flächendeckenden Gesichtserkennung oder dem Social Scoring. Die Implementierung einer solchen Regulierung kann dazu beitragen, die potenziellen Risiken von KI-Anwendungen zu minimieren und gleichzeitig die Menschenrechte zu schützen. Trotz entsprechender Initiativen sind die Ängste vor Manipulation und Missbrauch nicht kleinzureden. Dennoch wäre es falsch die Technologie zu verteufeln und das große Potenzial von KI durch Regulierungen zu verspielen. Die Technologie ist „nur“ ein Instrument deren Anwendung auch für unmoralische Interessen ausgenutzt werden kann. Umso wichtiger ist es sich mit den Methoden des Missbrauchs auseinanderzusetzen und Hersteller und Nutzende zur Verantwortung zu ziehen.
Wie genau diese Chancen erkannt und genutzt werden sollten, welche Rolle logische Umkehrschlüsse bzw. Rätsel im KI-Benchmark spielen, hören Sie in der aktuellen Podcast Folge von „Ausgesprochen digital“.
Moderiert wird diese Folge von Steffen Wenzel, Mitgründer und Geschäftsführer von politik-digital.
– – – – –
Weiterführende Links
👉 www.telekom-mms.com
👉 Zum Podcast
Foto: Telekom MMS