Google "libera" su base de datos de n-gramas
En el blog de investigación de Google acaban de anunciar que sus n-gramas ahora son nuestros, eso sí, previo pago de 150 dólares según el catálogo. Y es que el corpus se compone de 1,024,908,267,229 tokens (o palabras, vaya), 95,119,665,584 de frases y llega h...