Google zaprezentował cyfrowy magazyn, który ma być zbiorem niespełna pięciuset miliardów słów oraz umieścił także bazę danych złożoną z 5,2 milionów elektronicznych książek w językach angielskim francuskim, hiszpańskim, niemieckim, rosyjskim oraz chińskim. Zbiór ten obejmuje publikacje z lat 1500 – 2008. Wyszukiwarka jest darmowa. Dostępna jest pod adresem http://ngrams.googlelabs.com/
Działanie bazy danych przy wyszukiwarce Google polega na wpisaniu w niej pewnego słowa lub frazy (maksymalnie pięć słów przedzielonych przecinkami). Wynikiem powyższej operacji jest wykres przedstawiający częstotliwość występowania danego określenia bądź określeń w publikacjach książkowych na przestrzeni danego zakresu czasu. Dodatkowo Google wyświetla kilkuzdaniowe podsumowanie wskazujące przyczynę tego, że dany wykres wygląda tak, a nie inaczej. System podpiera to informacjami bibliograficznymi.
Tytułem przykładu: słowo „women” przed 1970 rokiem pojawiało się rzadziej, natomiast słowo „men” występowało zawsze często. W 1986 roku występowały już jednakowo często. Powodem takiego stanu rzeczy miałby być rozwój nurtu feministycznego w latach 70 XX wieku. Inny przykład – „Tiananmen” częściej pojawia się w języku angielskim niż w chińskim, a myszka Miki i Marilyn Monroe są mniej popularne niż Jimmy Carter. Powyższe przykłady pochodzą z przetestowania nowej wyszukiwarki przez ludzi z „New York Times”. Inne przykłady wskazują na to, że w tekstach anglojęzycznych bardziej popularnym niż Wojciech Jaruzelski jest Lech Wałęsa. Natomiast słowo „Poland” bardzo często pojawiało się w 1800 i 1945 roku.
Wyszukiwarka Google ma obrazować trendy w kulturze na przestrzeni ponad 500 lat. Możliwości tego rozwiązania, to otwarcie nowych perspektyw dla rozwoju badań oraz edukacji w dziedzinach humanistycznych (również językoznawców, którym łatwiej będzie aktualizować słowniki). Dwaj harvardzcy badacze – Erez Lieberman Aiden oraz Jean-Baptiste Michel zgromadzili dane i udostępnili je za pomocą Google’a. Chcą tym samym dowieść jak taka baza danych może wpływać na pojmowanie języka, kultury czy przepływu idei. Można chociażby zaobserwować, że wynalazki z 1800 roku musiały czekać około 66 lat na masowe upowszechnienie, a z kolei wynalazki z lat 1880 – 1927 potrzebowały na to tylko 27 lat. Baza danych obrazuje też, że od połowy XX wieku ilość słów w języku angielskim powiększyła się o 70 procent i osiągnęła milion wyrazów.
Google zeskanował dopiero 11 procent spośród wszystkich opublikowanych książek, co daje już prawie dwa biliony słów.