19. Juli 2024

KI News vom 19.07.2024

.

Brandheiße News aus der Welt der Künstlichen Intelligenz.

Hallo zusammen, es ist wieder Zeit für aktuelle und spannende News aus der Welt der Künstlichen Intelligenz!

1. RouteLLM: Ein Durchbruch im kosteneffektiven Routing für große Sprachmodelle

In einer kürzlich veröffentlichten Studie haben Forscher der UC Berkeley und Anyscale ein innovatives Open-Source-Framework namens RouteLLM vorgestellt. 
Dieses Framework bietet eine innovative Lösung für die Herausforderungen, die mit dem Routing von Anfragen an große Sprachmodelle (LLMs) verbunden sind. 
Der Artikel von MarkTechPost beschreibt die Ziele, den Aufbau und die Performance von RouteLLM im Detail.

Die Herausforderung

Das Routing von Anfragen an LLMs stellt eine erhebliche Herausforderung dar, insbesondere im Hinblick auf die Kosten und die Effizienz. 
Traditionell erfordert das Verarbeiten von Anfragen durch große Modelle beträchtliche Rechenressourcen, was sowohl hohe Kosten als auch längere Antwortzeiten mit sich bringt. 
Diese Herausforderungen machen es schwierig, LLMs in großem Maßstab effizient zu nutzen und zu implementieren.

Aufbau des RouteLLM-Frameworks

RouteLLM wurde entwickelt, um diese Probleme zu adressieren, indem es ein flexibles und skalierbares Routing-System anbietet. 
Das Framework basiert auf einer intelligenten Entscheidungslogik, die Anfragen basierend auf ihrer Komplexität und den verfügbaren Ressourcen an das geeignetste Modell weiterleitet. 
Hier sind einige Schlüsselkomponenten des RouteLLM-Frameworks:

Intelligente Anfrageanalyse: Das System analysiert eingehende Anfragen, um deren Komplexität und die erforderlichen Ressourcen zu bestimmen.
Dynamisches Routing: Basierend auf der Analyse werden Anfragen an das passendste Modell weitergeleitet, was sowohl kleinere, kostengünstigere Modelle als auch leistungsstarke, ressourcenintensive Modelle umfassen kann.
Skalierbarkeit: Das Framework ist darauf ausgelegt, in verschiedenen Umgebungen skalierbar zu sein, von kleinen Anwendungen bis hin zu großangelegten Implementierungen.

Performance und Kosten

Die Performance von RouteLLM zeigt beeindruckende Ergebnisse in Bezug auf Effizienz und Kostenreduktion. 
Durch das intelligente Routing können Ressourcen effizienter genutzt und die Gesamtkosten für den Einsatz von LLMs erheblich gesenkt werden. 
Zu den Hauptvorteilen gehören:

Kostenersparnis: 

Durch die Verwendung weniger ressourcenintensiver Modelle für einfachere Anfragen können die Betriebskosten signifikant reduziert werden.

Verbesserte Antwortzeiten: 

Das dynamische Routing sorgt dafür, dass Anfragen schneller beantwortet werden, indem sie an das optimal geeignete Modell weitergeleitet werden.

Skalierbare Leistung: 

RouteLLM ermöglicht eine flexible Skalierung der Rechenressourcen, um den Anforderungen verschiedenster Anwendungen gerecht zu werden.

Fazit

RouteLLM stellt einen bedeutenden Fortschritt im Bereich des effizienten Einsatzes großer Sprachmodelle dar. 
Mit seinem intelligenten Routing-Ansatz bietet es eine kosteneffektive und leistungsstarke Lösung für die Herausforderungen, die mit der Nutzung von LLMs verbunden sind. 
Das Framework ist auch auf Github zu finden. 

Quellen: 
Artikel auf MarkTechPost 

Wissenschaftliche Arbeit 

 

2. Web-Apps erstellen jetzt im Poe KI-Chat möglich 
Quora hat mit seinem AI-Tool Poe eine innovative Möglichkeit geschaffen, interaktive Web-Apps direkt im Chat zu erstellen. 
Mit Poe können Nutzer verschiedene KI-Modelle wie Claude 3.5 Sonnet, GPT-4o und Google Gemini 1.5 Pro nutzen, um ihre Ideen in funktionsfähige Web-Anwendungen umzusetzen. 
Das neue Feature namens "Previews" ermöglicht es, benutzerdefinierte, interaktive Erlebnisse zu schaffen, die über HTML, CSS und JavaScript verfügen.

Erstellen und Teilen von Previews

Previews können als Web-Apps angesehen werden, die durch einfache Texteingaben im Chat erstellt werden. 
Diese Web-Apps können verschiedene Funktionen wie Spiele, Animationen, Drag-and-Drop-Interfaces und Datenvisualisierungen umfassen. 
Das Besondere: Nutzer können ihre erstellten Previews über einen Link teilen und die Ausgaben in einem separaten Tab anzeigen lassen. 
Diese Funktionalität ist besonders für Nutzer interessant, die keine Programmierkenntnisse haben, aber dennoch interaktive Inhalte erstellen möchten.

Premium-Features und Nachteile

Aktuell ist die Möglichkeit, Previews zu erstellen, nur für Pro-Nutzer von Poe verfügbar. 
Ein Pro-Abonnement kostet etwa 19 Euro pro Monat und bietet neben der Erstellung von Previews auch schnellere und umfangreichere Antworten sowie den Zugang zu exklusiven KI-Modellen. 
Diese Einschränkung auf Premium-Nutzer könnte als Nachteil gesehen werden, insbesondere für diejenigen, die nur gelegentlich solche Funktionen nutzen möchten. 
Zudem bestehen Bedenken hinsichtlich des Schutzes geistigen Eigentums und der Transparenz der verwendeten Datenquellen.

Fazit

Poe von Quora stellt eine spannende Entwicklung im Bereich der KI-gestützten Content-Erstellung dar. 
Es bietet eine einfache Möglichkeit, komplexe Web-Apps zu erstellen und zu teilen, was sowohl die Produktivität als auch die Kreativität der Nutzer fördert. 
Trotz der derzeitigen Beschränkungen auf Premium-Nutzer zeigt diese Funktionalität das Potenzial von KI im Alltag und im professionellen Umfeld.

Quellen: 
- Artikel auf OnlineMarketing.de 
- Artikel auf TechCrunch 
- Artikel auf DataPhoenix

 

3. OpenAI sperrt seine Modelle für China

OpenAI hat kürzlich den Zugang zu seinen Modellen für Nutzer aus China, einschließlich Hongkong und Macau, gesperrt. 
Diese Entscheidung hat weitreichende Auswirkungen und wirft viele Fragen auf.

Gründe für die Sperrung

Die Sperrung der OpenAI-Modelle in China scheint stark von geopolitischen Spannungen beeinflusst zu sein. 
Insbesondere die Bemühungen der US-Regierung, Chinas Fortschritte im Bereich der Künstlichen Intelligenz (KI) zu bremsen, spielen hierbei eine Rolle. 
Die US-Behörden haben neue Vorschriften vorgeschlagen, die US-Unternehmen dazu zwingen, ihre Investitionen in chinesische KI-Projekte zu beschränken oder zu melden. 
Diese Maßnahmen sind Teil einer breiteren Strategie, die darauf abzielt, Chinas Zugang zu fortschrittlicher Technologie zu kontrollieren und einzuschränken.

Maßnahmen zur Durchsetzung der Sperrung

OpenAI hat den Zugang zu seinen API-Diensten für Entwickler in China offiziell unterbunden. 
Dies bedeutet, dass Entwickler in China keinen direkten Zugang mehr zu den leistungsstarken Modellen wie GPT-4 und anderen OpenAI-Diensten haben. 
Diese Sperrung umfasst sowohl den direkten Zugang über die OpenAI-Website als auch den Zugang über API-Schlüssel, die für die Integration in eigene Anwendungen genutzt werden.

Umgehung der Sperren durch Entwickler

Trotz dieser Restriktionen haben chinesische Entwickler Wege gefunden, die Sperren zu umgehen. 
Eine gängige Methode ist die Nutzung von Virtual Private Networks (VPNs), um den Standort ihrer Verbindung zu verschleiern und so weiterhin Zugang zu den OpenAI-Diensten zu erhalten. 
Darüber hinaus gibt es Berichte, dass Entwickler versuchen, über Dritte Zugang zu den APIs zu bekommen, was jedoch mit zusätzlichen Kosten und Risiken verbunden ist.

Auswirkungen und Reaktionen

Die Sperrung hat zu einer verstärkten Entwicklung lokaler Alternativen in China geführt. 
Chinesische Unternehmen wie Baidu, Alibaba und diverse Start-ups haben schnell reagiert und bieten nun eigene große Sprachmodelle (LLMs) an, 
um die Lücke zu füllen, die durch OpenAIs Rückzug entstanden ist. 
Diese Firmen bieten spezielle Migrationsdienste und Anreize, um ehemalige OpenAI-Nutzer zu gewinnen.

Quellen: 
Artikel in der South China Morning Post 
Artikel im Indian Express 
Artikel in der Tech Times

 

4. Teilweise Abweisung der Urheberrechtsklage gegen GitHub Copilot

Ein kalifornisches Gericht hat kürzlich eine Urheberrechtsklage gegen das von Microsoft betriebene Programmiertool GitHub Copilot teilweise abgewiesen. 
Diese Entscheidung hat weitreichende Implikationen für die Zukunft der Nutzung von KI in der Softwareentwicklung.

Hintergründe der Klage

Die Klage wurde 2022 von der Joseph Saveri Law Firm eingereicht und richtete sich gegen Microsoft, GitHub und OpenAI. 
Die Kläger warfen GitHub Copilot vor, urheberrechtlich geschützten Code ohne die erforderlichen Lizenzen und Attributionen zu reproduzieren. 
GitHub Copilot, das auf OpenAIs Codex-Modell basiert, wurde beschuldigt, Lizenzbedingungen von Open-Source-Software zu verletzen, indem es Code-Snippets ohne ordnungsgemäße Kennzeichnung einfügte.

Gründe für die Abweisung

Das Gericht wies die Klage teilweise ab, weil die Kläger nicht nachweisen konnten, dass Copilot identische Kopien von urheberrechtlich geschütztem Material erstellt hat. 
Laut dem Gericht müssen für Ansprüche nach dem Digital Millennium Copyright Act (DMCA) identische Kopien nachgewiesen werden. 
Da die Kläger dies nicht belegen konnten, wurden diese Ansprüche abgewiesen. Eine weitere Studie, die darauf hinwies, 
dass die Wahrscheinlichkeit, dass KI-Systeme ihre Trainingsdaten wörtlich wiedergeben, mit der Größe der Modelle zunimmt, 
konnte nicht spezifisch nachweisen, dass Copilot den Code der Kläger wörtlich reproduziert hat.

Auswirkungen und Weiterführung der Klage

Die Entscheidung des Gerichts könnte einen Präzedenzfall für die Nutzung von KI-Systemen schaffen, die auf urheberrechtlich geschützten Daten trainiert wurden. 
Solange diese Systeme keine wörtlichen Kopien der Trainingsdaten erzeugen, könnten Urheberrechtsansprüche schwer durchzusetzen sein. 
Dies könnte insbesondere für andere AI-Modelle und ähnliche Klagen von Bedeutung sein.

Obwohl viele Ansprüche abgewiesen wurden, erlaubte das Gericht die Fortführung eines Anspruchs wegen Vertragsbruch im Zusammenhang mit Open-Source-Lizenzvereinbarungen. 
Dies bedeutet, dass die Diskussion um die Einhaltung von Open-Source-Lizenzen durch AI-Tools wie Copilot weiterhin im Fokus bleibt.

Quellen:
The Decoder 
InfoWorld

 

5. Neue Produkte und KI-Features auf der Samsung Unpacked Konferenz 2024

Die Samsung Unpacked Konferenz im Juli 2024 hat eine Reihe beeindruckender neuer Produkte und KI-Features vorgestellt. 
Hier sind die Highlights der Veranstaltung und die jeweiligen Preise:

Galaxy Z Fold 6

Das neue Galaxy Z Fold 6 beeindruckt mit einem noch robusteren und flexibleren Display sowie einer verbesserten Kamera. 
Besonders hervorzuheben sind die neuen KI-gestützten Funktionen, die die Nutzererfahrung erheblich verbessern. 
Die Kamera nutzt fortschrittliche KI-Algorithmen zur Bildoptimierung, die automatisch Szenen erkennen und Einstellungen anpassen, um die bestmögliche Fotoqualität zu gewährleisten. 
Zusätzlich sorgt die KI dafür, dass der Akkuverbrauch optimiert und die Leistung des Geräts verbessert wird. 
Der Preis für das Galaxy Z Fold 6 liegt bei etwa 1.799 US-Dollar

Galaxy Flip 6

Das Galaxy Flip 6 bietet eine kompakte und stilvolle Alternative zum Fold-Modell. 
Es ist mit einem verbesserten Scharniermechanismus ausgestattet und bietet ebenfalls KI-unterstützte Kamerafunktionen. 
Die KI-Features umfassen unter anderem eine automatische Szenenerkennung und Optimierung der Kameraeinstellungen für beste Ergebnisse. 
Der Preis für das Galaxy Flip 6 beginnt bei 999 US-Dollar

Galaxy Watch 7 und Watch Ultra

Die neuen Galaxy Watch 7 und Watch Ultra Modelle sind nicht nur stilvolle Accessoires, sondern auch leistungsstarke Gesundheits- und Fitnessbegleiter. 
Die KI-Integration in diesen Uhren ermöglicht eine präzisere Überwachung von Gesundheitsdaten. 
Funktionen wie die automatische Erkennung von Trainingseinheiten und die Schlafanalyse wurden durch KI verbessert, um detailliertere und nützlichere Einblicke zu bieten. 
Die Watch Ultra bietet zudem eine neue Funktion zur Erkennung von Stürzen und Notfallbenachrichtigungen, die durch KI unterstützt wird. 
Die Galaxy Watch 7 startet bei 349 US-Dollar, während die Watch Ultra bei 599 US-Dollar beginnt

Galaxy Ring

Der Galaxy Ring ist ein völlig neues Produkt im Wearable-Segment von Samsung. 
Dieser Ring nutzt KI, um Gesundheitsdaten in Echtzeit zu überwachen und Analysen zu liefern. 
Er bietet Funktionen wie die kontinuierliche Überwachung der Herzfrequenz, die Analyse von Schlafmustern und sogar die Erkennung von Stressniveaus. 
Die KI-gestützten Algorithmen helfen dabei, personalisierte Empfehlungen zur Verbesserung der Gesundheit und des Wohlbefindens zu geben. Der Galaxy Ring kostet 199 US-Dollar.

Galaxy Buds

Die neuen Galaxy Buds bieten eine verbesserte Klangqualität und eine längere Akkulaufzeit. 
Mit Hilfe von KI werden Geräuschunterdrückung und Klangprofile automatisch angepasst, um das beste Hörerlebnis zu gewährleisten. 
Diese intelligente Anpassung berücksichtigt Umgebungsgeräusche und die individuellen Vorlieben der Nutzer, um eine optimale Audioqualität zu liefern. 
Die Galaxy Buds sind für 199 US-Dollar erhältlich.

Weitere Informationen zu den vorgestellten Produkten und deren Spezifikationen findest du auf den folgenden Seiten:

ZDNet 
The Verge 

Den offiziellen Replay der Unpack 2024 gibts auf YouTube

 

6. Google DeepMind stellt neuen Chatbot-Roboter vor

Google DeepMind hat einen revolutionären neuen Chatbot-Roboter vorgestellt, der eine Vielzahl von fortschrittlichen KI-Funktionalitäten bietet und auf dem neuesten Google KI-Modell basiert. 
Dieser Roboter nutzt das Gemini 1.5 Pro Modell, welches DeepMind entwickelt hat, um komplexe Aufgaben und Interaktionen zu bewältigen.

Das KI-Modell Gemini 1.5 Pro

Der neue Chatbot-Roboter von Google DeepMind basiert auf dem leistungsstarken Gemini 1.5 Pro Modell. 
Dieses Modell vereint Sprach- und Bildverarbeitung, was es dem Roboter ermöglicht, nicht nur textbasierte Konversationen zu führen, sondern auch visuelle Informationen zu interpretieren und darauf zu reagieren. Das Gemini 1.5 Pro Modell ist besonders bekannt für seine Fähigkeit, detaillierte und kontextbezogene Antworten zu geben, indem es umfangreiche Daten und fortschrittliche Algorithmen nutzt.

Funktionalitäten des Roboters

Der Chatbot-Roboter von Google DeepMind bietet eine breite Palette von Funktionalitäten:

Navigation und Interaktion: 
Der Roboter kann sich selbstständig in komplexen Umgebungen wie Büros bewegen. 
Er nutzt die Vision-Komponente des Gemini 1.5 Pro Modells, um Hindernisse zu erkennen und zu umgehen, sowie um visuelle Hinweise zu interpretieren und darauf zu reagieren.

Sprachverarbeitung:
Durch das fortschrittliche Sprachmodell kann der Roboter in natürlichen Gesprächen interagieren, Fragen beantworten und komplexe Anweisungen verstehen und ausführen.

Visuelle Interpretation: 
Der Roboter kann Bilder und Videos analysieren, um visuelle Informationen zu verarbeiten und darauf basierend Entscheidungen zu treffen. 
Dies umfasst das Erkennen von Objekten, das Lesen von Texten und das Verstehen von visuellen Szenen .

Zukünftige Pläne für den Roboter

Google DeepMind plant, die Fähigkeiten des Chatbot-Roboters weiter auszubauen und ihn in verschiedenen Bereichen einzusetzen. 
Zukünftige Updates könnten erweiterte Funktionen für den Einsatz in Büros, im Gesundheitswesen und in Bildungseinrichtungen umfassen. 
Ziel ist es, den Roboter zu einem vielseitigen Assistenten zu machen, der in unterschiedlichen Umgebungen und für verschiedene Aufgaben eingesetzt werden kann.

Zusätzlich plant Google DeepMind, die Interaktionsmöglichkeiten des Roboters durch maschinelles Lernen kontinuierlich zu verbessern, 
sodass er immer besser auf individuelle Nutzerbedürfnisse eingehen kann. 
Dies könnte auch die Integration mit anderen Google-Diensten und -Produkten umfassen, um eine nahtlose Benutzererfahrung zu gewährleisten .

Quellen:

Artikel auf Wired 
Artikel auf TechCrunch 
Artikel auf The Verge

 

7. Die erste Miss AI gekrönt: Kenza Layli aus Marokko gewinnt

Kenza Layli, eine von Phoenix AI entwickelte virtuelle Influencerin, zur ersten Miss AI gekrönt. 
Der Wettbewerb, organisiert von den World AI Creator Awards (WAICA), beurteilte über 1.500 Teilnehmer nach verschiedenen Kriterien. 
Layli, die über 200.000 Follower auf Instagram hat, setzt sich für Frauenrechte und Umweltschutz ein und repräsentiert moderne marokkanische Kultur.

Bewertungs- und Auswahlkriterien

Die Kandidaten wurden nach drei Hauptkriterien bewertet:

Schönheit

Hierbei wurde besonders auf die Konsistenz der Gesichtszüge sowie die Qualität der Details wie Hände, Augen und Kleidung geachtet.

Technologie: 

Die technische Umsetzung und die innovative Nutzung von KI-Technologien spielten eine wesentliche Rolle.

Social-Media-Präsenz: 

Die Reichweite und das Engagement auf sozialen Medien wurden ebenfalls berücksichtigt.

Eine Jury, bestehend aus menschlichen und KI-Richtern, wählte zunächst die Top-10-Finalisten aus, von denen dann die besten drei für den endgültigen Sieg konkurrierten. 
Kenza Layli triumphierte über ihre Mitbewerberinnen, darunter Lalina Valina aus Frankreich und Olivia C. aus Portugal, die den zweiten und dritten Platz belegten.

Quellen: 
Artikel auf NDTV

Deine Browser-Version ist anscheinend veraltet. Dadurch kann es zu Darstellungsfehlern auf dieser Webseite kommen.