References for SPLITTER
Package splitter pour la segmentation sémantique des documents.
Fournit les outils pour segmenter des documents textuels en chunks hiérarchiques optimisés pour la recherche vectorielle.
fallback_segmentation_stream(text, max_length)
Version streaming de la segmentation de secours pour économiser de la mémoire.
| Parameters: |
|
|---|
| Yields: |
|
|---|
semantic_segmentation_stream(text, max_length)
Génère les chunks sémantiques d'un document au fil de l'eau.
Version optimisée pour les grands corpus non structurés avec une meilleure extraction des frontières naturelles de texte et davantage de chunks.
| Parameters: |
|
|---|
| Yields: |
|
|---|