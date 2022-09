L’azienda Google ha mostrato, all’evento internazionale Cerca su, poiché i progressi dell’intelligenza artificiale stanno aiutando a trasformare i loro prodotti informativi, creando esperienze di ricerca più in sintonia con il modo in cui funziona la mente umana e multidimensionali come le persone stesse. Nell’evento menzionato si sono presentati tre novità per trovare esattamente quello che cerchiamo nelle nostre ricerche combinando immagini, suoni, testo e voce, come fanno naturalmente gli esseri umani.

Una ricerca visiva più naturale, con ricerca multipla, un nuovo modo di fare ricerche utilizzando immagini e testo contemporaneamente.

La traduzione dell’ambiente. Utilizzando i progressi dell’intelligenza artificiale, Google passa dalla traduzione di testo alla traduzione di immagini. Oggi viene già utilizzato più di un miliardo di volte al mese per tradurre il testo delle immagini in più di cento lingue.

Usare la visione immersiva per esplorare il mondo. Attraverso i progressi nella visione artificiale e nei modelli predittivi, ha reinventato ciò che intendiamo per “mappa”. I classici bidimensionali si evolveranno in una visione multidimensionale del mondo reale, permettendoti di vivere un luogo come se fossi lì.

“Lavoriamo alla nostra missione da oltre due decenni per organizzare le informazioni nel mondo e renderle accessibili e utili a tutti. All’inizio si trattava di una ricerca di testo, ma nel tempo abbiamo creato modi più naturali e intuitivi per trovare le informazioni Ad esempio, ora puoi cercare ciò che vedi con la fotocamera o fare domande ad alta voce”, è stato riportato durante l’evento.

Dal punto di vista di Google, c’è un assaggio di un mondo in cui puoi trovare esattamente quello che stai cercando combinando immagini, suoni, testo e vocecome fa naturalmente l’essere umano.

ricerca visiva

Utilizza le telecamere come strumento, la tastiera del futuro, con cui accedere alle informazioni e comprendere meglio l’ambiente. Nel 2017 nasce Lens, che ci permette di cercare ciò che vediamo utilizzando la fotocamera o un’immagine. Oggi, Lens viene utilizzato per rispondere a otto miliardi di domande ogni mese.

La ricerca visiva è più naturale con la ricerca multipla, un nuovo modo di cercare utilizzando immagini e testo contemporaneamente. Da qualche mese è stata implementata negli Stati Uniti la versione beta della modalità multi-ricerca e, in Search On, è stato annunciato che sarà disponibile in più di settanta lingue nei prossimi mesi. Un ulteriore passo avanti è dato con il multiricerca vicino a me, che permette di scattare una foto di qualcosa di sconosciuto, come un piatto di cibo o una pianta, e trovarla in un luogo vicino, come un ristorante o un garden center. Questo autunno, questo strumento sarà lanciato in inglese, negli Stati Uniti.

Traduci il mondo intorno

Uno dei maggiori potenziali della percezione visiva è la sua capacità di abbattere le barriere linguistiche. Attraverso l’intelligenza artificiale, si è passati dalla traduzione di testi alla traduzione di immagini. Google è già utilizzato più di un miliardo di volte al mese per tradurre il testo delle immagini in più di cento lingue. Ma spesso è la combinazione delle parole e del loro contesto (le immagini in cui è inscritto il testo) a costituire il significato. Oggi, il testo tradotto viene già combinato con quelle immagini contestuali, grazie a una tecnologia di apprendimento automatico chiamata Reti generative contraddittorie (RGA o GAN). Se, ad esempio, la fotocamera viene puntata su una rivista in un’altra lingua, vedremo sullo schermo il testo tradotto sovrapposto alle immagini di accompagnamento.

visione immersiva

Grazie ai progressi nella visione artificiale e nei modelli predittivi, Google sta reinventando le mappe. I classici bidimensionali si evolveranno in una visione multidimensionale, che ti permetterà di vivere un luogo in modo personalizzato.

Così come la possibilità di controllare il traffico in tempo reale in modalità navigazione ha modificato Google Maps, rendendolo più utile, un altro significativo progresso è stato ottenuto con la visualizzazione immersiva di Google Maps, con maggiori informazioni come le condizioni meteorologiche o l’affollamento di un luogo. determinato luogo. Con questa esperienza è possibile farsi un’idea di com’è un luogo prima ancora di metterci piede, decidere dove si vuole andare e quando.

Unendo una rappresentazione avanzata del mondo con modelli predittivi, fornisce informazioni sull’aspetto di un luogo domani, la prossima settimana o anche tra un mese. Ad oggi, la prima versione di questa funzione è stata ampliata con immagini aeree di duecentocinquanta enclavi emblematiche. Nei prossimi mesi, la visione immersiva arriverà in cinque grandi città.