16 Matching Annotations
  1. Nov 2023
    1. El resultado es un vector de caracteres, un objeto unidimensional que consta únicamente de elementos representados como caracteres.

      A vector is simply a list of items that are of the same type.

      To combine the list of items to a vector, use the c() function and separate the items by a comma. Ver más:

    2. métodos básicos de estilometría

      "La estilometría analiza ciertos rasgos del estilo del autor y los utiliza para comparar dos o más textos. El punto de base de la estilometría es que el estilo es algo que nace en el subconsciente, y por esta razón, cada quien tiene su estilo propio. Por otro lado, la estilometría es una forma de analizar textos a diferentes niveles. Algunas de sus aplicaciones es determinar la autoría de una obra, la autenticidad, clasificación de textos, medición de frecuencia de palabras, identificación de lenguas." Ver más:

      http://humanidadesdigitales.net/que-es-la-estilometria-y-para-que-sirve/

    3. tokenizador (tokenizer)

      En el procesamiento del lenguaje natural, un tokenizador es una herramienta que se utiliza para dividir un texto en unidades discretas llamadas "tokens". Un token puede ser una palabra, una puntuación, un número, un símbolo u otra unidad significativa en el texto. El objetivo del tokenizador es preparar el texto para el análisis y el modelado en el aprendizaje automático. Ver más: https://gamco.es/glosario/tokenizadores/

  2. Jun 2023