Testen Sie unser fortschrittlichstes Modell, Gemini 1.5 Pro Experimental, das bis zu einer Million Token-Kontextfenster unterstützt.

KI-APIs für Google Cloud

Mit den KI- und ML-APIs von Google Cloud können Sie KI ganz einfach in Ihre Anwendungen einbinden. Neukunden erhalten ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

Jetzt kostenlos starten Alle KI-Produkte ansehen

Anwendungsfall	APIs	Geeignet für
APIs für generative AI	Grundlagenmodell-APIs Vortrainierte große Multitasking-Modelle wie Gemini, die mithilfe von Vertex AI auf bestimmte Aufgaben abgestimmt oder angepasst werden können. Diese multimodalen Modelle von Google können Vision, Dialog, Codegenerierung, Codevervollständigung und mehr übernehmen.	Generierung von Textvervollständigungen, mehrstufigen Chats und Texteinbettungen Codevervollständigung und ‑erstellung mit Codey Bilder mit Imagen generieren und anpassen Universelle Sprachmodelle
APIs für generative AI	Vertex AI Agent Builder API Stellt eine Schritt-für-Schritt-Orchestrierung von Such- und Konversationsanwendungen für Unternehmen mit vordefinierten Workflows für allgemeine Aufgaben wie Onboarding, Datenaufnahme und Anpassung bereit.	Such-App in Google-Qualität mit eigenen Daten erstellen Multimodale Anwendungen erstellen, die auf Text, Bilder und anderen Medien reagieren können Zusammenfassungen auf Basis von generativer KI
APIs für Machine Learning	Vertex AI API Hochwertige benutzerdefinierte Modelle für Machine Learning mit minimalem Aufwand und Fachwissen im Bereich des maschinellen Lernens trainieren.	Benutzerdefiniertes ML-Training ML-Modelle testen, überwachen und optimieren Bereitstellung von über 100 Modellen, einschließlich multimodaler und Foundation Models wie Gemini
Speech, Text und Language APIs	Natural Language API Durch Machine Learning Informationen aus unstrukturiertem Text gewinnen	Natural Language Understanding auf Anwendungen mit der Natural Language API anwenden Offene ML-Modelle zum Klassifizieren, Extrahieren und Erkennen von Stimmungen
	Speech‑to‑Text API Mit einer API auf Grundlage der KI-Technologien von Google Gesprochenes treffsicher in Text umwandeln	Automatische Spracherkennung Transkription in Echtzeit Erweiterte Anrufmodelle in Google Contact Center AI
	Text‑to‑Speech API Mit einer KI-gestützten API von Google wandeln Sie Text in natürlich klingende Sprache um.	Kundeninteraktionen verbessern Stimmliche Benutzeroberfläche in Geräten und Anwendungen Personalisierte Kommunikation
	Translation API Stellen Sie Inhalte und Apps mit schneller, dynamischer maschineller Übersetzung mehrsprachig zur Verfügung.	Echtzeit-Übersetzung Überzeugende Lokalisierung Ihrer Inhalte Internationalisierung Ihrer Produkte
Bild- und Video-APIs	Vision API Integrieren Sie Funktionen zur visuellen Erkennung, einschließlich Bildbeschriftung, Gesichts- und Sehenswürdigkeiten-Erkennung, optische Zeichenerkennung (Optical Character Recognition, OCR) und das Tagging expliziter Inhalte.	Bilder mit ML präzise vorhersagen und verstehen Bilder schnell Millionen vordefinierter Kategorien zuordnen
Bild- und Video-APIs	Video Intelligence API Der Weg zur einfachen Ermittlung von Inhalten sowie zu relevanten Videos	Umfassende Metadaten auf Video-, Aufnahmen- oder Frameebene extrahieren Videoanalyse zur Erkennung von über 20.000 Objekten, Orten und Aktionen in Videos
Dokument- und Daten-APIs	Document AI API Vortrainierte Modelle für die Dokumentverarbeitung, einschließlich Basisextraktoren wie OCR und Formularparser, sowie spezielle Modelle für branchenspezifische Anwendungsfälle in den Bereichen Kreditvergabe, Verträge, Beschaffung und Identitätsdokumente.	Daten aus Dokumenten extrahieren, klassifizieren und aufteilen Manuelle Dokumentverarbeitung und Einrichtungskosten reduzieren Aus Dokumentdaten Erkenntnisse gewinnen
Dokument- und Daten-APIs	Document Warehouse-API Integrierte, cloudbasierte Plattform zum Speichern, Suchen, Organisieren, Steuern und Analysieren von Dokumenten und deren strukturierten Metadaten.	Detaillierte Zugriffssteuerung (Berechtigungen) auf Dokument- und Ordnerebene Extrahierte und getaggte Metadaten verwalten
Dialogorientierte KI-APIs	Dialogflow API Konversationelle KI-Plattform mit absichtsbasierten und generativen KI-LLM-Funktionen zum Erstellen natürlicher, umfangreicher dialogorientierter Funktionen in mobilen Apps und Webanwendungen, Smart-Home-Geräten, Bots, interaktiven Sprachdialogsystemen, beliebten Messaging-Plattformen und mehr.	Natürliche Interaktionen für komplexe Unterhaltungen über mehrere Themen Erweiterte Agents schnell erstellen und bereitstellen Skalierbarkeit auf Unternehmensniveau Chatbot basierend auf einer Website oder einer Sammlung von Dokumenten erstellen

APIs für generative AI

Grundlagenmodell-APIs

Vortrainierte große Multitasking-Modelle wie Gemini, die mithilfe von Vertex AI auf bestimmte Aufgaben abgestimmt oder angepasst werden können. Diese multimodalen Modelle von Google können Vision, Dialog, Codegenerierung, Codevervollständigung und mehr übernehmen.

Generierung von Textvervollständigungen, mehrstufigen Chats und Texteinbettungen
Codevervollständigung und ‑erstellung mit Codey
Bilder mit Imagen generieren und anpassen
Universelle Sprachmodelle

APIs für Machine Learning

Vertex AI API

Hochwertige benutzerdefinierte Modelle für Machine Learning mit minimalem Aufwand und Fachwissen im Bereich des maschinellen Lernens trainieren.

Benutzerdefiniertes ML-Training
ML-Modelle testen, überwachen und optimieren
Bereitstellung von über 100 Modellen, einschließlich multimodaler und Foundation Models wie Gemini

Speech, Text und Language APIs

Natural Language API

Durch Machine Learning Informationen aus unstrukturiertem Text gewinnen

Natural Language Understanding auf Anwendungen mit der Natural Language API anwenden
Offene ML-Modelle zum Klassifizieren, Extrahieren und Erkennen von Stimmungen

Bild- und Video-APIs

Vision API

Integrieren Sie Funktionen zur visuellen Erkennung, einschließlich Bildbeschriftung, Gesichts- und Sehenswürdigkeiten-Erkennung, optische Zeichenerkennung (Optical Character Recognition, OCR) und das Tagging expliziter Inhalte.

Bilder mit ML präzise vorhersagen und verstehen
Bilder schnell Millionen vordefinierter Kategorien zuordnen

Dokument- und Daten-APIs

Document AI API

Vortrainierte Modelle für die Dokumentverarbeitung, einschließlich Basisextraktoren wie OCR und Formularparser, sowie spezielle Modelle für branchenspezifische Anwendungsfälle in den Bereichen Kreditvergabe, Verträge, Beschaffung und Identitätsdokumente.

Daten aus Dokumenten extrahieren, klassifizieren und aufteilen
Manuelle Dokumentverarbeitung und Einrichtungskosten reduzieren
Aus Dokumentdaten Erkenntnisse gewinnen

Dialogorientierte KI-APIs

Dialogflow API

Konversationelle KI-Plattform mit absichtsbasierten und generativen KI-LLM-Funktionen zum Erstellen natürlicher, umfangreicher dialogorientierter Funktionen in mobilen Apps und Webanwendungen, Smart-Home-Geräten, Bots, interaktiven Sprachdialogsystemen, beliebten Messaging-Plattformen und mehr.

Natürliche Interaktionen für komplexe Unterhaltungen über mehrere Themen
Erweiterte Agents schnell erstellen und bereitstellen
Skalierbarkeit auf Unternehmensniveau
Chatbot basierend auf einer Website oder einer Sammlung von Dokumenten erstellen

Sind Sie bereit, mit KI zu arbeiten?

Mit Tools und Diensten jeder Kenntnisstufe das Potenzial von KI nutzen.

Kontakt

Hier erfahren Sie, wie generative KI in den allgemeinen Lebenszyklus der Softwareentwicklung passt.

Blog lesen

KI-Produkte von Google Cloud entsprechen unseren SLA-Richtlinien. Sie bieten eventuell von anderen Google Cloud-Diensten abweichende Latenz- oder Verfügbarkeitsgarantien.

Gleich loslegen

Profitieren Sie von einem Guthaben über 300 $, um Google Cloud und mehr als 20 „Immer kostenlos“-Produkte kennenzulernen.

Jetzt kostenlos starten

Benötigen Sie Hilfe beim Einstieg?
Vertrieb kontaktieren
Mit einem zertifizierten Partner arbeiten
Partner finden
Mehr ansehen
Alle Produkte ansehen

KI-APIs für Google Cloud

APIs für generative AI

Grundlagenmodell-APIs

Vertex AI Agent Builder API

APIs für Machine Learning

Vertex AI API

Speech, Text und Language APIs

Natural Language API

Speech‑to‑Text API

Text‑to‑Speech API

Translation API

Bild- und Video-APIs

Vision API

Video Intelligence API

Dokument- und Daten-APIs

Document AI API

Document Warehouse-API

Dialogorientierte KI-APIs

Dialogflow API

APIs für generative AI

Grundlagenmodell-APIs

APIs für Machine Learning

Vertex AI API

Speech, Text und Language APIs

Natural Language API

Bild- und Video-APIs

Vision API

Dokument- und Daten-APIs

Document AI API

Dialogorientierte KI-APIs

Dialogflow API

Sind Sie bereit, mit KI zu arbeiten?

Gleich loslegen

Benötigen Sie Hilfe beim Einstieg?

Mit einem zertifizierten Partner arbeiten

Mehr ansehen