Wie MASV die KI-Workflows erleichtert (und die Markteinführungszeit verkürzt) auf S3

von | 6.11.2024

Workflows mit künstlicher Intelligenz (KI) aller Art erfordern in der Regel große Mengen an Daten - oft unstrukturierte Daten wie Videos und Bilder -, um Modelle angemessen zu trainieren und genaue Erkenntnisse zu gewinnen. Doch all diese Daten in einen Cloud-Bucket oder einen anderen Speicher zu bekommen, damit Sie KI-Workflows darauf ausführen können, kann eine Herausforderung sein:

  • Das Hinzufügen großer Datensätze zu Amazon S3 kann beispielsweise ein technischer Prozess sein, der einen mehrteiligen Upload mit einem Befehlszeilenschnittstellen-Tool (CLI) erfordert.
  • Das native Hochladen großer Datensätze auf S3 ist oft langsam und unzuverlässig.

Diese Probleme können sich erheblich auf die Markteinführungszeit von KI-Unternehmen auswirken, die sich einen Wettbewerbsvorteil erhoffen.

MASV vereinfacht jedoch die Dateneingabe für die KI-Verarbeitung und verkürzt die Markteinführungszeit für KI-Unternehmen, um KI-Modelle zu monetarisieren und zu operationalisieren.einschließlich Twelve Labs, die zusammen mit MASV kürzlich einen benutzerdefinierten KI-Workflow mit S3-Objektspeicher vorgestellt haben.

Hinweis: Dieser Workflow wurde von MASV CTO Majed Alhajry und Twelve Labs Head of Growth Maninder Saini auf der IBC 2024 vorgestellt. Hier ist ein Link zum Video ihrer Präsentation.

Inhaltsübersicht

Einfaches Einlesen großer Datensätze für KI-Arbeitslasten

Genießen Sie mit MASV die sichere, zuverlässige und schnelle Übertragung von massiven 4K-, 8K- oder 12K-Videodateien und anderen großen Datensätzen.

Was können KI-Workflows für Video leisten?

An dieser Stelle alle Vorteile von KI-Tools für die Videoproduktion und andere Anwendungen zu erläutern, mag Zeitverschwendung sein - die meisten von uns haben vieles davon schon einmal gehört. Aber die Technologie entwickelt sich so schnell, dass ich es trotzdem erklären werde. Wenn es um Videoproduktionen geht, kann KI:

  • Durchführen komplexe Analyse auf Filmmaterial, um Transkriptionen, Markierungen und anderen Kontext zu erzeugen, wie z. B. das Videoverständnis und die Videosuche von Twelve Labs.
  • Erzeugen Sie realistische Originalvideos, wie z. B. Heygendas mithilfe generativer KI Videos in Studioqualität in mehr als 170 Sprachen produzieren kann.
  • Text in Sprache umwandeln, Audiobereinigungund KI-basierte Synchronisation in andere Sprachen, wie sie von Unternehmen wie ElevenLabs angeboten wird.
  • Beschleunigen Postproduktion und sich wiederholende Aufgaben Einsatz von KI-Automatisierung, wie z. B. Izotope Neuron für die Audiomischung und Runway für die Maskierung.
  • Es geht auch nicht nur um professionelle Videoproduktion: Unternehmen wie Spatialdata.ai optische Sensordaten und maschinelles Lernen nutzen, um den Zustand und das Risiko kritischer Anlagen besser einschätzen zu können.

Letztendlich stehen aber alle diese Anwendungen vor einer ähnlichen Herausforderung: Die Bewältigung riesiger Datenmengen und deren Speicherung für die KI-Automatisierung, das Modelltraining und die Ausführung.

Die verborgene Herausforderung von KI-Workflows: Daten-Ingest

"Ich habe das Modell, ich muss nur noch die Daten in das Modell übertragen".

Klingt einfach, oder? Aber wie oft hat jemand, der regelmäßig mit komplexen KI-Algorithmen arbeitet oder sie entwickelt, das schon gehört?

Die Antwort? Sehr viel. Das liegt daran, dass eine der größten Herausforderungen bei der Arbeit mit KI darin besteht, die riesigen Datenmengen, die zum Trainieren und Ausführen dieser Modelle benötigt werden, an einem Ort zu sammeln, beispielsweise in einem S3-Bucket.

  • Das Hochladen großer Datensätze auf S3 ist in der Regel ein zeitaufwändiger Prozess, der durch strenge Dateigrößenbeschränkungen behindert wird und oft technisches Fachwissen erfordert, z. B. beim mehrteiligen Upload über CLI.
  • Viele Anwendungen von Drittanbietern, die Daten in die Cloud übertragen sollen, wie Cyberduck, basieren auf dem Dateiübertragungsprotokoll (FTP) - was auch viel technischer ist als die verwaltete Dateiübertragung, außerdem ist es langsam und unsicher.
Platzhalterbild

Um KI-Workloads und ähnliche Aufgaben, die Cloud-Computing erfordern, auszuführen, müssen die Nutzer Daten von der rechten Seite des obigen Diagramms (Maschinen, Menschen und Anwendungen) in die von den Cloud-Service-Anbietern auf der linken Seite bereitgestellten Dienste übertragen.

Daraus ergeben sich Herausforderungen in Bezug auf Konten, die erstellt werden müssen, Schlüssel, die generiert werden müssen, und den Zugriff, der für mehrere Benutzer verwaltet werden muss - zusammen mit den oben erwähnten Leistungs-, Zuverlässigkeits- und Sicherheitsproblemen.

Wenn Sie MASV in die Mitte dieses Workflows stellen, haben Sie von einem einzigen Punkt aus Zugriff auf all diese Services von all Ihren Mitarbeitern, Anwendungen und Maschinen.

Und das ist der springende Punkt in der Diskussion: Wie können KI-Unternehmen ihre Nutzer in die Lage versetzen, große Datensätze schnell, sicher und ohne technische Probleme in der Cloud zu speichern, damit sie KI-Algorithmen und generative KI ohne große Verzögerungen auf den Daten ausführen können?

Der MASV-S3-Twelve Labs Modell-Workflow

Die einfache, aber leistungsstarke Dateiübertragungstechnologie von MASV hilft bei der Lösung dieses Problems, weshalb andere KI-Unternehmen wie ElevenLabs, SpatialData.aiund HeyGen verwenden auch MASV, um Daten in die Cloud zu übertragen.

Diese KI-Workflow-Automatisierung kann eine Menge Zeit und Frustration einsparen und Ihren Nutzern beim Hochladen großer Datensätze in den Cloud-Speicher erhebliche Schwierigkeiten ersparen.

💡 Hinweis: Dieser Arbeitsablauf kann mit anderen KI-Tools, die über eine API verfügen, und mit anderen in MASV integrierten Cloud-Speicherplattformen repliziert werden. Die vollständige Liste der MASV-Integrationen finden Sie unter hier.

Verwendete Tools

  • MASV-Portale. Die Entwicklung einer webbasierten und anpassbaren MASV-Portal File Uploader erfordert keine Software- oder Plugin-Installationen, bietet eine globale Beschleunigung der Dateiübertragung und eine hohe Zuverlässigkeit - und er kann auch dazu beitragen, Daten schnell in die Cloud zu bringen, um KI-Workloads auszuführen.
  • MASV-Integrationen und -Automatisierungen. Code-freie Integrationen und Dateitransfer-Automatisierungen kann in wenigen Minuten so konfiguriert werden, dass Dateien automatisch in den Cloud-Speicher aufgenommen werden, ähnlich wie ein KI-Workflow-Automatisierungstool.
  • Amazon S3. Ein hoch skalierbarer Cloud-Objektspeicherdienst mit hoher Verfügbarkeit und Leistung, der von vielen KI-Unternehmen genutzt wird, zusammen mit AWS Lambda serverlose Funktionen.
  • Zwölf Labore multimodales Videoverständnis KI-Funktionen. Kann Terabytes oder Petabytes von Videos für die KI-Suche, Klassifizierung und andere Funktionen analysieren und so die mit der manuellen Suche verbundenen sich wiederholenden Aufgaben eliminieren.
Platzhalterbild

Hier eine schrittweise Anleitung für unseren automatisierten Arbeitsablauf:

  1. Registrieren Sie sich für ein MASV-Konto. Es ist kostenlos.
  2. Verbinden Sie S3 über MASV No-Code-Integrationen mit Ihrem Konto.
  3. Richten Sie ein benutzerdefiniertes oder sofortiges MASV-Portal ein: Konfigurieren Sie den Namen Ihres Portals, die Benachrichtigungseinstellungen und richten Sie eine automatisierter Portal-Download zu Ihrem integrierten Cloud-Speicher.
    1. Sie können auch Datei-Uploads auf Ihr MASV-Portal über MASV Watch Folders automatisieren.
    2. Sie können auch benutzerdefinierte Datei-Upload-Workflows über den MASV Transfer Agent oder die API einrichten, aber das würde den Rahmen dieses Artikels sprengen.
  4. Erstellen einer Lambda-Funktion die die Twelve Labs-API verwendet und bei der Erstellung von Objekten in Ihrem Cloud-Speicher ausgelöst wird.

Sie können jetzt Dateien in Ihr MASV-Portal hochladen:

  1. Ziehen Sie Ihre Dateien per Drag-and-Drop in das MASV-Portal hoch.
  2. Die vorkonfigurierte MASV-Automatisierung sendet die Dateien dann automatisch an Ihren S3-Bucket. Mit MASV können Sie Dateien mit einer Größe von bis zu 5 TB auf S3 hochladen. Vorsicht!
  3. Die Lambda-Funktion wird dann ausgelöst, die eine JSON-Nutzlast erzeugt, die dann die Twelve Labs API aufruft.
  4. Twelve Labs beginnt mit der Indizierung Ihrer Dateien mithilfe von videogestützter KI und ermöglicht es Ihnen, KI- oder andere Hochleistungs-Computing-Workloads auf den Dateien in der Cloud auszuführen.

Die Ausgabe

Von dort aus können Sie die KI-Technologie von Twelve Labs nutzen, um eine Reihe von Aktionen durchzuführen, z. B. die semantische Suche anstelle der manuellen Suche und das Tagging.

  • Die Benutzer können das System beispielsweise auffordern, aus Hunderten oder Tausenden von Stunden Filmmaterial ein Highlight-Video mit allen Toren eines bestimmten Spielers oder einer Mannschaft zu erstellen oder die wichtigsten erzählerischen Momente für die Fans zu finden.
  • Oder Sie können das System bitten, lange Videoclips zur besseren Organisation in Kapitel zu unterteilen.
Platzhalterbild

MASV: Die ideale Lösung zum Ingest von Big Data in S3 für KI-Workloads

MASVdie Cloud-basierte Plattform für die Übertragung großer Dateien macht es Anwendern leicht, große Dateien für KI-Workflows mühelos auf S3 hochzuladen und so die Markteinführungszeit für KI-Unternehmen in einer äußerst wettbewerbsintensiven (und schnelllebigen) Branche zu verkürzen.

MASV bietet alle Tools und Funktionen für den Betrieb von freihändigen Cloud-, On-Premise- oder Hybrid-Cloud Upload- und Dateiverwaltungs-Workflows, indem sie die einfache Übertragung von großen Medienbeständen erleichtern:

  • Ein vereinfachter, webbasierter, pluginfreier, zuverlässiger und universeller Uploader, der schlüsselfertig und vollständig anpassbar ist.
Platzhalterbild
  • Eine Suite von Automatisierungswerkzeugen für die Dateiübertragung ohne Code.
  • Dokumentation für Entwickler und Werkzeuge, einschließlich der MASV-API und Cloud-/Netzwerk-Integrationen vor Ort, mit denen Sie anspruchsvolle automatisierte Workflows erstellen können, z. B. die Bereitstellung von Dateien in Cloud-Buckets ohne Reibungsverluste für Ihre Endbenutzer.
  • Unerreichte Dateiübertragungsleistung, die mit bis zu 10 Gbit/s optimierten Leitungen mithalten kann.
  • Unerbittliche Zuverlässigkeit bei der Dateiübertragung: MASV erholt sich von Netzwerkinstabilitäten und wiederholt automatisch alle Übertragungen, selbst bei Netzwerkausfällen, bis sie abgeschlossen sind.
  • Keine Begrenzung der Dateigröße beim Hochladen von Dateipaketen.
  • Sicherheitstools auf Unternehmensniveau und die Einhaltung der wichtigsten Datenschutzbestimmungen von Anfang an.

Für MASV anmelden und erhalten Sie jeden Monat kostenlose Transferkredite, um diesen automatisierten KI-Workflow zu testen (oder jeden anderen Arbeitsablauf der Dateiübertragung die für Ihr Unternehmen sinnvoll ist).

Dateien ohne Einschränkungen übertragen

Große Dateien? Kein Problem. MASV hat keine Grenzen für Dateipakete und verarbeitet Dateipakete von unbegrenzter Größe.