Merci pour cette réponse rapide. Je crois que j’avais déjà essayé ça mais comme les 2 derniers liens avec l’id de la transcription je tombe sur un “Not found”
Je voulais mettre les end-tokens, mais ceci ne fonctionne pas
$ teklia-dan dataset tokens entities.yml --end-tokens
Traceback (most recent call last):
File "/webhome/arkindex/venv/bin/teklia-dan", line 8, in <module>
sys.exit(main())
^^^^^^
File "/webhome/arkindex/venv/lib/python3.11/site-packages/dan/cli.py", line 31, in main
status = args.pop("func")(**args)
^^^^^^^^^^^^^^^^^^^^^^^^
File "/webhome/arkindex/venv/lib/python3.11/site-packages/dan/datasets/tokens/generate.py", line 35, in run
"start": next(token_generator),
^^^^^^^^^^^^^^^^^^^^^
File "/webhome/arkindex/venv/lib/python3.11/site-packages/dan/datasets/tokens/generate.py", line 23, in get_token
raise Exception(f"More than {LIMIT} tokens asked")
Exception: More than 160 tokens asked
Puis
$ teklia-dan dataset extract teklia-bis-ecru-20250926-085330.sqlite --dataset-id 3c0e97c9-7c75-4bc5-ac7d-6d754378ed1b --element-type page --output data --tokens tokens.yml
2025-11-14 08:28:45,836 WARNING/dan.datasets.extract.arkindex: Dataset NER Sémantique (3c0e97c9-7c75-4bc5-ac7d-6d754378ed1b) does not have "train", "val" and "test" steps
pareil pour
$ teklia-dan dataset extract teklia-bis-ecru-20250926-085330.sqlite --dataset-id 078ed541-7db8-4e90-92b9-81ded412ad12 --element-type page --output data --tokens tokens.yml
2025-11-14 08:27:25,174 WARNING/dan.datasets.extract.arkindex: Dataset BIS | ECRU: BIS ECRU: Annotated sample training dataset v1 - Sémantique (078ed541-7db8-4e90-92b9-81ded412ad12) does not have "train", "val" and "test" steps
Bonjour,
je teste directement pour le moment, pour essayer de comprendre, et là j’ai un not found : https://demo.arkindex.org/api/v1/transcription/13ed425a-a153-4e98-8fcb-17b283468882/entities/