You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Dado el sigueinte csv:
texto,categoria
"el gato el gato el gato el gato el gato","gato"
"el perro el perro el perro el perro el perro","perro"
"la casa la casa la casa la casa la casa","casa"
"el avión el avión el avión el avión el avión","avión"
"la playa la playa la playa la playa la playa","playa"
"el gato el perro el gato el perro el gato","mezcla"
"el perro el gato el perro el gato el perro","mezcla"
"la playa la casa la playa la casa la playa","mezcla"
Al usar tfidf con stop words y ngramas el cluster de la ultima oracion de nuestro csv no lo agrupa en el cluster correcto, que en este caso deberia estar con la oracion 6 y 7
Describe your proposed solution
Podemos mencionar las limitaciones con textos repetidos en la documentacion o mejorar los calculos para poder manejar textos con poco significado semantico y palabras repetidas.
Describe alternatives you've considered, if relevant
No response
Additional context
No response
The text was updated successfully, but these errors were encountered:
Uh oh!
There was an error while loading. Please reload this page.
Describe the workflow you want to enable
Dado el sigueinte csv:
texto,categoria
"el gato el gato el gato el gato el gato","gato"
"el perro el perro el perro el perro el perro","perro"
"la casa la casa la casa la casa la casa","casa"
"el avión el avión el avión el avión el avión","avión"
"la playa la playa la playa la playa la playa","playa"
"el gato el perro el gato el perro el gato","mezcla"
"el perro el gato el perro el gato el perro","mezcla"
"la playa la casa la playa la casa la playa","mezcla"
Al usar tfidf con stop words y ngramas el cluster de la ultima oracion de nuestro csv no lo agrupa en el cluster correcto, que en este caso deberia estar con la oracion 6 y 7
Describe your proposed solution
Podemos mencionar las limitaciones con textos repetidos en la documentacion o mejorar los calculos para poder manejar textos con poco significado semantico y palabras repetidas.
Describe alternatives you've considered, if relevant
No response
Additional context
No response
The text was updated successfully, but these errors were encountered: