IA generativa con Amazon Neptune

Analisi a grafo ad alte prestazioni e database serverless per scalabilità e disponibilità superiori

Panoramica

Con la creazione e l'implementazione di applicazioni di intelligenza artificiale (IA) generativa, le organizzazioni aumentano progressivamente le loro aspettative relative alla precisione, alla completezza e alla chiarezza esplicativa. Fornire un contesto aziendale e specifico del dominio attraverso tecniche come la generazione potenziata tramite recupero (RAG) può aiutare in una certa misura; la RAG è efficiente in termini di costi nel fornire informazioni attuali e pertinenti per l'IA generativa, mantenendo al contempo la governance e il controllo dei dati.

La generazione potenziata tramite recupero di grafi (GraphRAG) porta la RAG a un livello superiore, avvalendosi della potenza dell'analisi dei grafi e della ricerca vettoriale per migliorare l'accuratezza, la completezza e la spiegabilità delle risposte dell'IA. La GraphRAG ottiene questo risultato sfruttando le relazioni tra entità o elementi strutturali nei dati, come sezioni o titoli in relazione ai blocchi di testo dei documenti, per fornire i dati più rilevanti come input per le applicazioni RAG. Attraverso l'uso di grafi di conoscenza, le applicazioni RAG possono recuperare connessioni multi-hop tra entità o argomenti correlati e utilizzare questi dati per aumentare una risposta generativa.

IA generativa con Amazon Neptune

Amazon offre procedure completamente gestite e autogestite per la creazione e l'esecuzione di applicazioni GraphRAG.

  • Completamente gestite: le knowledge base di Amazon Bedrock offrono il primo servizio GraphRAG completamente gestito al mondo con Amazon Neptune. Gestisce automaticamente la creazione e la manutenzione di grafici e embedding, consentendo ai clienti di fornire risposte più pertinenti agli utenti finali. Essendo un servizio completamente gestito, è possibile evitare le sfide dell'impostazione delle configurazioni e dell'integrazione con altri LLM o database vettoriali. 
  • Autogestite: sono disponibili due opzioni per gli utenti che desiderano ricorrere all'hosting autonomo o avere flessibilità per la connessione a origini dati personalizzate, l'integrazione con prodotti di terze parti (modelli di fondazione, archivi vettoriali, datastore) e effettuare l'hosting autonomo del proprio stack di applicazioni di IA generativa.
    • Kit di strumenti AWS GraphRAG Python: AWS ha rilasciato il kit di strumenti open source GraphRAG, che supporta modelli di fondazione e grafi aggiornati. Offre un framework per automatizzare la costruzione di un grafo a partire da dati non strutturati e per interrogarlo in risposta alle domande degli utenti.
    • Framework open source: AWS supporta e contribuisce a progetti open source popolari come LangChain e LlamaIndex per la creazione di pipeline di produzione RAG.

Gli utenti che non hanno familiarità con i linguaggi di query per i database a grafo possono sfruttare l'integrazione di Neptune con LangChain. Ciò consente di interrogare il database a grafo Neptune utilizzando il linguaggio naturale. Ad esempio, è possibile utilizzare la catena di controllo qualità NeptuneOpenCypherQAChain per tradurre domande dall'inglese in query openCypher e restituire una risposta leggibile dall'uomo. Questa catena può essere utilizzata per rispondere a domande come “Quale aeroporto degli Stati Uniti ha le rotte in uscita più lunghe e più brevi?”

LangChain è un framework Python open source progettato per semplificare la creazione di applicazioni utilizzando modelli linguistici di grandi dimensioni (LLM). L'integrazione di Neptune con LangChain consente agli sviluppatori di utilizzare il framework open source di LangChain per semplificare la creazione di applicazioni sensibili al contesto.

Con Neptune e LangChain, puoi restituire una risposta in base al contesto fornito e interrogare un database a grafo Neptune utilizzando il linguaggio di query OpenCypher. Ad esempio, puoi utilizzare la catena di controllo qualità OpenCypher di Neptune per tradurre domande dall'inglese in query OpenCypher e restituire una risposta leggibile dall'uomo. Questa catena può essere utilizzata per rispondere a domande come «Quante rotte in uscita ha l'aeroporto di Austin?»

Per maggiori dettagli sulla catena di qualità OpenCypher di Neptune, consulta la documentazione open source di LangChain.

LlamaIndex è un framework di dati open source per connettere origini dati personalizzate a modelli linguistici di grandi dimensioni (LLM) e supporta l'uso di grafici di conoscenza con LLM.

Con LlamaIndex, puoi utilizzare Neptune come archivio di grafici o archivio vettoriale per creare applicazioni di IA generativa utilizzando tecniche come GraphRag.

Casi d'uso

GraphRAG può essere utilizzato per migliorare service desk IT e contact center. Ad esempio, GraphRAG può consentire ai team del Security Operations Center (SOC) di interpretare gli avvisi in modo più accurato per aiutare a proteggere i sistemi critici. Un chatbot di assistenza per i membri del settore sanitario può trovare velocemente informazioni rilevanti in grandi volumi di letteratura medica per rispondere a domande complesse su sintomi, terapie e risultati dei pazienti.

Le applicazioni GraphRAG possono offrire informazioni approfondite a team in funzioni aziendali come pianificazione finanziaria e contabilità (FP&A), marketing, ufficio legale, risorse umane, ecc. Ad esempio, i team legali delle aziende possono trovare in modo più efficace le informazioni in merito a normative fiscali, regolamenti e casi precedenti al fine di sviluppare strategie per i casi. I team di marketing possono creare profili customer 360 in base alle relazioni sociali e alla cronologia di acquisti dei potenziali clienti.

Le aziende di tutti i settori beneficiano di GraphRAG. Ad esempio, nel settore farmaceutico, i team di ricerca e sviluppo possono utilizzare GraphRAG per velocizzare la ricerca e la sperimentazione dei farmaci. Nel settore dei servizi bancari di investimento, la capacità di GraphRAG di mappare relazioni complesse e offrire una visione olistica delle dichiarazioni aziendali aiuta i team di due diligence a utilizzare RAG per scoprire approfondimenti, come diritti normativi e dinamiche concorrenziali, che non sarebbero immediatamente evidenti.

I consigli tradizionali utilizzano i servizi di analisi manualmente per formulare raccomandazioni sui prodotti. Neptune ML è in grado di identificare nuove relazioni direttamente sui dati grafici e di consigliare facilmente l'elenco dei giochi che un giocatore sarebbe interessato ad acquistare, altri giocatori da seguire o prodotti da acquistare.

Prezzi

Non sono necessari investimenti iniziali. Paghi solo per le risorse AWS utilizzate come Amazon SageMaker, Neptune e Amazon Simple Storage Service (Amazon S3).

Nozioni di base

Esistono molti modi per iniziare, come i seguenti: