Rechercher dans ce blog

28 avril 2026

Fedora Linux 44 teffeɣ-d

 Ihi anagraw n wammud Fedora Linux 44 yeffeɣ-d ass-a.

Aseɣwen : https://fedoraproject.org/kab/workstation/ 

Fedora Linux 44


 Fedora Workstation i ileḥḥun s GNOME 50 yella s teqbaylit.


 

26 avril 2026

Correcteur orthographique en kabyle pour Firefox

 Beaucoup ne le savent pas mais un module complémentaire appellé "Imseɣti asnalɣan n tutlayt taqbaylit" pour le navigateur Web Mozilla Firefox permet aux utilisateur⋅rice⋅s de vérifier leur orthographe lors de la rédaction sur le Web.

 Ce module est un vérificateur orthographique pour Hunspell porté sur Firefox et est disponible en téléchargement depuis novembre 2017.

Kabyle Spell Checker for Mozilla Firefox

 Ce vérificateur orthographique en kabyle est la seconde version du genre, d'un premier vérificateur orthographique initié par Paul Anderson et Kamal Bouamara sur la base du dictionnaire Kabyle "Issin", une version corrigée et améliorée par Mohand Belkcem.

 Imseɣti asnalɣan n tutlayt taqbaylit est disponible sur :

https://addons.mozilla.org/kab/firefox/addon/imse%C9%A3ti-n-tira-n-teqbaylit/ 

La première version produite par Paul Anderson et Kamal Bouamara comportant quelques irrégularités se trouve sur : https://addons.mozilla.org/kab/firefox/addon/tira-n-teqbaylit/

Hébergé quant à lui sur SourceForge, si vous désirez consulter le code :

https://sourceforge.net/projects/tiranteqbaylit/files/

 Ou encore si vous désirez consulter les pages Wiki du projet initié en 2015 :

https://sourceforge.net/p/tiranteqbaylit/wiki/browse_pages/

Ce correcteur orthographique est également disponible pour la suite bureautique LibreOffice : https://extensions.libreoffice.org/en/extensions/show/tira-n-teqbaylit 

Il faut savoir que ce projet de correcteur orthographique n'est pas définitif mais améliorable (c'est un travail qui devrait être continu) par n'importe qui qui s'intéresserait à doter cette langue amazigh avec des outils informatiques standardisés dédiés.

 

20 avril 2026

Kabyle TTS avec OmniVoice

 OmniVoice est un projet qui permet de prononcer un texte en clonant une voix. Nous avons testé avec plusieurs voix de lire le texte de ce paragraphe en kabyle :

OmniVoice

 

Akken ad yelḥu uselkim, ilaq ad yessebded fell-as yiwen, ayen mi neqqar anagraw, anagraw n wammud. Ma yella unagraw-a d ilelli, nekni akken it nebɣa. Gar inagrawen-a n wammud llan inagrawen i yettwabnan ɣef yiɣes n Linux, yal yiwen yezmer ad ten-id-isader seg web s war lexlaṣ, ad ten-isebded ɣef yibenk-is, neɣ ɣef uselkim-is (ama d aselkim n ufus neɣ n  tnarit). Nezmer ad nebder, d amedya, anagraw n wammud n Debian : d anagraw n wammud urkid gar inagrawen ilelliyen nniḍen. 

 Voici le résultat généré par OmniVoice :

  Fichier MP3

Plus de détails sur ce fil de discussion sur Mastodon : https://mstdn.fr/@ButterflyOfFire/116419126391497807 

 Vous pouvez tester OmniVoice sur HugginFace : https://huggingface.co/spaces/k2-fsa/OmniVoice

En mode  CPU sur ce space :  https://huggingface.co/spaces/boffire/OmniVoice-kabyle

 Vidéos : https://www.youtube.com/@Taqbay1337/videos

 

16 avril 2026

Mmeslay : Reconnaissance vocale en kabyle

 Mmeslay est un projet de reconnaissance vocale en kabyle STT (SpeechToText ou Voice recognition) initié il y a quelques années par Aomer Gaya Ouldali en collaboration avec Mohand Belkacem.

Mmeslay sur Github
 

Maintenant, il est possible de le tester en ligne et de tenter une retranscription de votre voix en kabyle : vous prononcez une phrase ou dictez un texte ou vous enregistrez votre voix dans un format audio et vous le transférez sur l'instance de démo de Mmeslay en ligne sur HugginFace; vous obtiendrez une transcription en mode texte de votre message vocal avec un taux réduit d'erreurs.

Adresse de la démo : https://huggingface.co/spaces/g1ya/Mmeslay 

Le projet fonctionne sous une forme hybride de traitement : un modèle acoustique accompagné d'un modèle lexical.

Nous n'avons pas encore testé côté "language switching" ni concernant les nouveaux mots qui ne figurent pas dans un lexique. Mais grossomodo, il est fonctionnel.

Maintenant, on pourrait imaginer un système où lors de l'obtention de la transcription, on pourra utiliser une instance LibreTranslate afin de traduire automatiquement la transcription obtenue en kabyle vers l'anglais ou le japonnais.

 LibreTranslate : https://huggingface.co/spaces/Imsidag-community/LibreTranslate_Kabyle 

Code source du projet Mmeslay : https://github.com/G1ya777/Mmeslay_backend-CLI 

A propos de l'auteur : https://g1ya777.github.io/portfolio/ 

13 avril 2026

Keypunch - Testez votre agilité sur un clavier en kabyle

 Keypunch est un logiciel libre et ouvert qui permet de tester l'agilité de vos doigts lors de la saisie sur un clavier.

En effet, un tas d'outils permettant d'évaluer sa maîtrise de saisie sur différentes dispositions de clavier dans d'autres langues existent mais aucun n'offrait jusque là la possibilité de prendre en charge la langue kabyle.

Pour ce, nous avons non seulement participé à rendre Keypunch disponible en kabyle, en participant à sa traduction mais nous avons fait appel à un groupe d'enseignants en Tamazight à Tizi-Ouzou à participer en nous fournissant une liste de mots couvrant tout l'alphabet latin utilisé en kabyle lors d'une rédaction.

Keypunch est installable sur n'importe quelle distribution et/ou système GNU/Linux, si vous désirez l'installer et le tester via Flathub : https://flathub.org/kab/apps/dev.bragefuglseth.Keypunch

 

Le logiciel Keypunch

Vous devez d'abord choisir le texte de la langue dans laquelle vous souhaitez tester vos performances.

Ici, on choisit : Taqbaylit (Kabyle)

Menu de choix des langues sur Keypunch
 

Le mode de fonctionnement de Keypunch est simple : il affiche aléatoirement des mots qui s’enchaînent en kabyle sous forme d'un texte à saisir au clavier.

Texte aléatoire en kabyle sur Keypunch

Une fois que l'utilisateur aura saisit le texte aléatoire affiché sur Keypunch dans le temps répartit, une fenêtre de statistiques apparaît comprenant le taux de précision lors de la saisie ainsi que le nombre de mots par minute. Vous pourrez ainsi comparer vos exploits en matière de maîtrise de votre clavier.

Statistique de saisie clavier sur Keypunch

 L'idée de participer à un tel projet est venue du fait que malgré la disponibilité de dispositions de claviers en kabyle utilisant les caractères latins, personne n'a demandé l'avis des utilisateur·rices quant au confort offert ou pas par ces dispositions existantes.

En effet, certaines méthodes de saisie, en kabyle, sous Linux, offrent plus de confort que d'autres et nous cherchons constamment des méthodes alternatives pouvant offrir une meilleure expérience utilisateur en matière de saisie au clavier.

Lorsque la saisie sur une disposition clavier devient complexe ceci pousse les utilisateurs à ne pas écrire dans leur propre langue et opter pour des langues étrangères dans leurs moyens de communication.

Vous pouvez, par exemple, utiliser Keypunch dans une école, en invitant un groupe d'élèves, d'étudiant·e·s, d'enseignant·e·s, d'auteur·rice·s ou de journalistes à tester deux dispositions de claviers kabyles différentes et leur demander leur avis laquelle est plus performante par rapport à l'autre tout en ayant des statistiques à l'appui. Et comment peut-on faire pour pouvoir créer d'autres nouvelles dispositions plus confortables, au delà de l'aspect purement AZERTY/QWERTY/QWERTZ.

Vocablaire :

  • Le mot clavier se dit anasiw en kabyle.

Si vous avez des questions ou des suggestions, vous pouvez nous contacter sur le réseau social Mastodon : https://mastodon.online/@kabyle 

 

 

03 avril 2026

Liste des anacycliques en kabyle

     Selon Wikipédia, un anacyclique est un mot ou un groupe de mots qui conserve un sens lorsqu'on le lit de droite à gauche. (source)

Voici une liste de mots anacyclique en kabyle que nous avons pu obtenir via une analyse d'un corpus. Chaque mot possède un premier sens lorsqu'il est lu de gauche à droite et un sens différent lorsqu'il est lu de droite à gauche :

Exemple :

medden / neddem 
medden : (les gens, les autres)
neddem : Du verbe ddem signifiant prendre, lever, porter, soulever, se mettre à ...

Voici la liste que nous a pu collecter : 

  • agi – iga
  • tili – ilit
  • slen – nels
  • tura – arut
  • ilan – nali
  • ɣur – ruɣ
  • akken – nekka
  • azgen – negza
  • nella – allen
  • tella – allet
  • isura – arusi
  • sens – snes
  • tmurt – trumt
  • medden – neddem
  • tmura – arumt 

Source : https://butterflyoffire.codeberg.page/ 

A vous d'en découvrir d'autres.  

Mots palindromes en kabyle

     Voici une liste de mots palindromes en langue kabyle issus d'une analyse d'un corpus textuel conséquent. Ces mots se lisent de la même manière de droite à gauche et de gauche à droite.

Nous publions cette liste, pour le plaisir, car nous n'avons trouvé sur le web aucune publication parlant des palindromes en kabyle.

  • ass-a 
  • bab
  • bib 
  • ihi
  • ili
  • iri 
  • imi
  • ini
  • izi
  • uhu
  • aha
  • ala
  • ama
  • aya
  • akka
  • awwi
  • assu
  • uzzu
  • ababa
  • nessen
  • nissin 
  • neqqen
  • qelleq
  • tebbet
  • tiqqit 
  • tafat
  • tesset
  • tewwet
  • tissit
  • tizit
  • ttett
  • tiririt
  • warraw
  • ɣeẓẓeɣ 

A vous d'en découvrir d'autres. 

Source : https://butterflyoffire.codeberg.page/ 

 

24 janvier 2026

Iseɣẓanen ilelliyen

Iseɣẓanen ilelliyen

    Deg umaḍal n tsenselkimt llan waṭas n wahilen, deg-sen wid i wumi neqqar iseɣẓanen ilelliyen. Efkan-asen isem-a axaṭaṛ tangalt taɣbalut n wahilen-a teldi, s lemɛna nniḍen, tangalt taɣbalut s wacu ittwarun wahilen-a, yal yiwen yezmer ad tt-yaf deg uWeb : yal amdan yezmer ad tt-tiɣeṛ, ad tt-ibeddel, ad itt-senfel, ad tt-iseɣti akken id-is-yehwa, yernu yezmer ad d-yessufeɣ lqem nniḍen amaynut seg-s.

    Mačči am wahilen d-xedment taṛmisin akked tkubbanyin n tiknulujit timeqqṛanin i yettwassnen, am tkebbaniyin n Temrikt n ugada : isnasen-nsent akked wahilen-nsent mačči d ilelliyen : mačči menwala izmer aten-ibeddel s tefses, yerna tangalt-nsen leɛmeṛ ur telli tazayazt i wakken medden ad izmiren ad ẓren dacu i ixeddmen wahilen-a, s tuffra sdaxel n iselkimen, s deffir n weɛrur n iseqdacen.

    Ma yewwid uselkim ad yelḥu, ilaq-aɣ ad nẓer d acu i ixeddmen wahilen i nessebded fell-as. Ma yella ur-d newwi ara s lexbeṛ d acu ixeddmen mebla ma cawren-aɣ-d, ulamek ara t-namen, neɣ ur-d yewwi ara ad t-namen.

    Dayesmi, aṭas i yellan wid d-yeqqaṛen, ur-ɣ ilaq ad nesseqdec ala ahilen ilelliyen, ala iseɣẓanen n uɣbalu yeldin iwakken ad nesɛu asenqed s ufus-nneɣ ɣef ufecku asenselkam i yellan gar ifassen-nneɣ. I wakken daɣen, ur nettaǧa ara walbɛaḍ n taṛmisin ad-aɣ teṭṭef deg waḍad qerriḥen, ad anuɣal ala gar ifassen-nsent, ad-aɣ seddayent akken kan id asent-ihwa.

    Win yessnen taneflit tasenselkamt, yezmer ad iɣeṛ tangalt n useɣẓan n uɣbalu yeldin s tefses, ma yufa llant degs tuccḍiwin, yezmer ad-tent-iseɣti, ad irnu asiɣzef deg-sen, ad tisnernu, i wakken ad nesfaydi, deg useɣti umaynut, akken ma nella.

    Akken ad yelḥu uselkim, ilaq ad yessebded fell-as yiwen, ayen mi neqqar anagraw, anagraw n wammud. Ma yella unagraw-a d ilelli, nekni akken it nebɣa. Gar inagrawen-a n wammud llan inagrawen i yettwabnan ɣef yiɣes n Linux, yal yiwen yezmer ad ten-id-isader seg web s war lexlaṣ, ad ten-isebded ɣef yibenk-is, neɣ ɣef uselkim-is (ama n ufus neɣ n ufellaru). Nezmer ad nebder, d amedya, anagraw n wammud n Debian : d anagraw n wammud urkid gar inagrawen nniḍen.

    Mebla anagraw n wammud, ur yezmir ara uselkim ad yelḥu. D netta akk i d lsas n usekker n yal aselkim. Deg-s akk ifecka imezwura i weɛqal n warrumen n uselkim s umata : ama d aɛqal n tewwura USB, neɣ n tkerḍiwin n ubeqqeḍ, n umeslaw, imeɣṛiyen n iḍebsiyen, akked wayen icudden ɣer tkarḍa tayemmat s umata.

    Ma yella unagraw-nneɣ n wammud d ilelli, nezmer ad nettkel fell-as ad aɣ-yesselḥu aselkim-nneɣ akken iwata, d wakken it-nebɣa. Ur nettagad ara ad-aɣ-ixeddem kra n texnanasin ur nettwali ara, mi ara yekker.

    Mi ara yekker unagraw n wammud, dayen yessuli-d akk ifecka izwaranen, ad yaweḍ ad-aɣ-d yesken tanarit, neɣ afellaru. Syin, nezmer ad nemmeslay ɣef iseɣẓanen ilelliyen nniḍen i nesseqdac yal ass.

    S umata, inagrawen n wammud yebnan ɣef yiɣes n Linux, neɣ Izuzar n Linux, Iwzawazen n Linux sefraken tutlayt taqbaylit s wudem amezwer : aṭas n imedhalen n usebded n yizurar n Linux i izemren ad ssumren i useqdac ad ifren tutlayt-is tamezwert send asbeddi n unagraw. Ula d anasiw yesɛan isekkilen ilatiniyen s wacu i nettaru taqbaylit, ttwasummren-d deg uḥric n unsawi n umedhal-a n usbeddi i wakken ad yuɣal unagraw s timmad-is ileḥu s tutlayt i yebɣa useqdac.

    Anect-a, ulac it ass-a, deg inagrawen n wammud nniḍen ur yellin ara d ilelliyen, amedya, am Windows i texdem teṛmist tamarikanit n Microsoft : Windows ur-k-d yessumur ara ad tt-ferneḍ tutlayt taqbaylit deg umedhal-is n usbeddi. Ad k-d-yessumer tutalyin nniḍen, akk d inasiwen nniḍen.

    Ar wass n wass-a, anagraw-a n wammud i teznuzuy Microsoft ur yesɛi agrudem udlif n useqdac s tutlayt-nneɣ. Ula d awitay-is, neɣ tasmektit d-yeddan fell-as, tella kan s tutlayin nniḍen.

    Ɣef aya, izuzar n Linux s umata lhan imi sefraken taqbaylit s tefses, s wudem amezwer, bdu-tt-id kan seg umedhal n usbeddi alamma d tagara n usbeddi n unagraw.

    Ɣas akka, deg tmurt, ur nettaru ara s waṭas, s isekkilen n uskript n tfinaɣ, ula d tarrayt n tira s tfinaɣ tella deg umedhal n usbeddi n yizuzar n Linux. Anida ulac-itt nezmer ad tt-nernu.

    Ilaq ad as-nefk i useqdac tilelli n ufran n ifecka-ines isenselkamen. Ur ilaq ara ad nḥettem fell-as ayen nebɣa nekni, neɣ ayen ur yebɣi ara, netta.

    Win neɣ tin yebɣan ad tt-aru s isekkilen n tfinaɣ ad tefren tarrayin id tiwulmen gar tid yellan deg tebdart n tarrayin n tira n unasiw mebla ma yenɛettab yiwen ad inadi ad isbedd ahilen imernan seld ma yettusbedd unagraw.

    Ihi, ɣer tagara mi ara yettusbedd unagra n wammud ad aɣ-yawi ɣer tnarit neɣ ɣer ufellaru, syin nezmer ad nsekker iseɣẓanen neɣ isnasen n umahil n yal ass, neɣ uraren yellan deg-s.
 

Isnasen n yal ass / Iseɣẓanen n yal ass
Isnasen ilelliyen n uɣbalu yeldin n yal ass i useqdec ɣef tnarit neɣ iseɣẓanen n ufellaru.

    D acu ara naf neg ufellaru neɣ deg tnarit mi dayen yekker unagraw ?

Asmel web n gnome.org

 

    Deg tnarit nezmer ad naf tignitin n iseɣẓanen akked yesnasen. Yal udem n tnarit ur yettcabi ɣer wayeḍ : yal yiwet tesɛa udem-is, initen-is, aɣanib-is, isental-is d-yeddan yid-s.

    Ifecka akked iseɣẓanen n umahil, ad aten-yaf useqdac deg tfeggagt n unagraw. Yal afecku yettusettef deg taggayt-is : ifecka n wadduf ɣer Internet ad ten-naf deg taggayt Internet, wid n tussna deg taggayt n Tussna, wid n usefser n yeḍrisen deg ifecka n twurmahilt, uraren deg tebdart n wurar, ifecka n unagraw deg taggayt n iɣewwaren n tedbelt, ar tagara.

    Deg ufellaru naɣ deg tnarit, nezmer ad nwali azemz akked wakud n wass deg tiɣmert n ugdil. Mačči kan ad nwali azemz akked wakud, ma nsenned fell-as ad naf awitay akked tesmektit i tedyanin akked d ineḍruyen n wass, neɣ n wid n ddurt, neɣ n wayyur akked wid n useggas. Ma yella wazemz neɣ akud d arameɣtuten syin ara nekcem ɣer iɣewwaren-is i wakken ad ten-seɣwer, ad sseɣti tawila-nsen.

    Tafeggagt n unagraw tesɛa, tegber daɣen, ula d nettat, tignitin n kra n yiseɣẓanen imatuten i yettiḥwiǧ useqdac yal ass. Asiti neɣ asenned ɣef yiwet deg-sent ad yefk adduf arurad ar walbɛaḍ n useɣẓan i yettusbedden : ad it-sekker.

    Ma yebɣa useqdac ad yemdel tiɣimit-is tamirant, neɣ ad yeqqen s umiḍan nniḍen n useqdac wis sin, neɣ ad yeldi tiɣimit s umiḍan nniḍen, neɣ ma yewwi-d ad yalles asekker neɣ ad yessexsi aselkim-is, llant tqeffalin i wakka deg tfeggagt n unagraw.

    Iznan i yettwali useqdac deg ugrudem udlif, a wi yufan ad ilin akk s teqbaylit seg mi ara yekker uselkim alamma yensa : Am win i d-yusan ar tmurt : ur sellen imeẓẓuɣen ala tutlayt n warraw akked yessi-s n tmurt : seg mi ara tt-yebdu s w « Ansuf yis-k » alamma yexsi uselkim, d taqbaylit.

    Mi ara yennam weqcic amecṭuḥ yesseqdac aselkim-is s teqbaylit, ad iwalef, ad yaɣ ddɛen d wawalen n tsenselkimt. Ahat, ussan imezwura ad as-d-ttbinen kra n wawalen d imaynuten, lameɛna, cwiṭ cwiṭ kan ad yaɣ tannumi, ad ten-ilmed, ad yuɣal ad ten-iseqdec.

    Ɣef aya, nessaram, ahat iseɣẓanen-a ilelliyen deg tsenselkimt, am uẓawan-nneɣ, am yedlisen-nneɣ, am tmucuha-nneɣ, ad ilin d wid ara yḥerzen awalen n tutlayt-nneɣ i wakken ur negren ara, i wakken ad idiren.

Tazmilt : Ẓriɣ llant tuccḍiwin deg tira n uḍris-a. Ma tzemreḍ ad t-tesseɣtiḍ, ad d-ssufɣeɣ talɣa nniḍen zeddigen. Tanemmirt imi d-tefkiḍ cwiṭ n lweqt*-ik,  n wakud, ad teɣṛeḍ aḍris-a.

15 janvier 2026

amazigh-date - Un outil qui permet d'afficher les dates selon le calendrier amazigh

    Le calendrier amazigh (ou berbère) n’est pas qu’une curiosité culturelle : il est utilisé pour marquer les fêtes agricoles, les évènements historiques et surtout Yennayer, le nouvel an amazigh qui tombe le 12 janvier (ou 13/14 selon les régions).

    Malheureusement, à ce jour, aucune bibliothèque Python ne proposait une conversion simple du calendrier « grégorien vers le calendrier amazigh ». nous avons donc écrit amazigh-date, un module qui permet d'effectuer cette conversion en ligne de commande :

 

amazigh-date dans un terminal

    amazigh-date est un micro-module Python qui transforme n’importe quelle date grégorienne en calendrier amazigh : il calcule l’année (≈ +950), affiche le mois (Yennayer, Fuṛar…), le jour et le jour de la semaine (Acer, Arim…), peut afficher le résultat brut ou orné du sigle « Mz » (Mz pour l'ère Amazigh), décompte les jours restant jusqu’au prochain Yennayer et génère également un fichier iCalendar complet d’une année entière pour l’importer dans Google Calendar ou Outlook.

Pour installer amazigh-date, il suffit d'ouvrir un terminal et de saisir la comande :

python -m pip install amazigh-date

Pour afficher la date du jour équivalente au calendrier amazigh :

amazigh-date 

Arim 1 Yennayer 2976

 Vous pouvez utiliser l'opérateur --yennayer 12 ou --yennayer 13 ou --yennayer 14 si vous considérez que Yennayer commence vers l'une de ces dates dans votre région.

Exemple :

amazigh-date --yennayer 14
Amhad 2 Yennayer 2976

 Afin de calculer le nombre de jours restants jusqu'au début du prochain nouvel an amazigh, vous pousez utiliser la commande :

amazigh-date --countdown
362 days until Yennayer (12 Jan 2027).

Vous pouvez trouver l'outil amazigh-date sur :

pypi : https://pypi.org/project/amazigh-date/

Codeberg : https://codeberg.org/butterflyoffire/amazigh-date

Afin de souhaiter une "bonne année" à quelqu'un en amazigh, en kabyle ou autre, on dit : Aseggas ameggaz.

    Du coup, je vous dis à quoi correspond le 1 Yennayer de l'an 1 du calendrier amazigh par rapport au calendrier grégorien, vous diriez que cela correspond à quelle date ? Et comment appelle-t-on l'ère d'avant l'an 1 du calendrier amazigh ?

    En attendant, nous travaillons sur l'élaboration d'un système de calendrier amazigh pour Linux afin de pouvoir donner la possibilité aux utilisateurs le choisir et de l'appliquer à travers leurs environnements.

Calendrier sur la barre des taches de l’environnement Cinnamon, sous Linux Mint, affichant un calendrier avec nom de jour, mois et année selon le système du calendrier amazigh.

 


 


 


 



28 décembre 2025

Kabyle OCR - Optical character recognition

 Jusqu'à récemment, il n'existait aucun modèle qui permettait de faire de la reconnaissance optique de caractères des textes rédigés en kabyle, c'est à dire, en utilisant des caractères latins, notamment pour la reconnaissance des caractères suivants : ẓẒ, ṛṚ, ṭṬ, ɛƐ, ɣƔ, ṣṢ, ḍḌ, ǧǦ, ḥḤ, čČ sur les documents scannés aplatis (pdf aplatis, captures d'écran, anciens documents scannés, images scannées provenant de romans ou de livres, ...)

tesseract-ocr

 

 Jusqu'à ce que Bouaziz Aït Driss publie son modèle qu'il a entraîné le 07 décembre 2025. 

C'est un modèle pour tesseract-ocr, disponible publiquement et utilisable sous Linux comme sous Windows.

 Lien Github : https://github.com/Bouaziz-aitd/Kab_Taqbaylit_Tesseract_OCR

Lien Hugging Face : https://huggingface.co/AitBAD/kab-Taqbaylit-Tesseract-ocr 

    Bien que le Computer Science Departement de l'Université de Tizi Ouzou avait déclaré que des étudiants ont pu développé un modèle OCR en kabyle en novembre 2024, aucune trace du projet, malheureusement, n'a été rendue publique sur aucune forge logicielle.

La vidéo de l'Université de Tizi Ouzou : https://www.youtube.com/watch?v=drhr2v3lLtY 

Notons néanmoins, que Google via son service Cloud Vision arrivait tout de même à faire de l'OCR en kabyle. Ceci dit, leur service demeure commercial et n'est pas à la portée de tout le monde.

Langues prises en charge par Google Cloud Vision : https://docs.cloud.google.com/vision/docs/languages 

20 octobre 2025

Kabyle Text Cleaner

 Kabyle Text Cleaner is a command-line utility and Python library designed to normalize Kabyle text. It converts non-standard Greek/Latin look-alike characters to proper Latin-derived letters used in Kabyle language.

Kabyle Text Cleaner on a terminal
Kabyle Text Cleaner on a terminal

 

The need for such tool came after we tried to extract text from some PDFs written in kabyle language. We noticed that due to old keyboard layouts, people still typing non Unicode latin symbols on their writings.

So when you extract text you will find yourself with a corpus you have to correct.

By using Kabyle Text Cleaner, you will be able to clean at least some of the corpus, normalize some words to their standard form instead of using a corpus full of symbols that make your text not only diffucult to read but difficult to process too.

 Kabyle Text Cleaner does not correct, clean and normalize everything right now but we will try together to improve it.

If you are on Linux, you can install Kabyle Text Cleaner via pip command.

First you need to extract text from a PDF and give it name then you need to create a venv :

python -m venv kab

Activate your venv : 

source kab/bin/activate 

Installe Kabyle Text Cleaner via pip :

pip install kabyle-text-cleaner

Now you are ready to process your text file. First, let's check if there are some foreign symbols used inside your text file.

kabtxtcleaner text.txt

Notice that the command to call is kabtxtcleaner

To clean your text, type this command and you'll get a cleaner version in the same workng directory :

kabtxtcleaner text.txt -o clean.txt --fix

or 

kabtxtcleaner text.txt -o kab_clean.txt --fix 

Kabyle Text Cleaner is available on pypi : https://pypi.org/project/kabyle-text-cleaner/

And on Git :  https://github.com/Imsidag/kabyle-text-cleaner

You're welcome to open issues and ask for improvements if you notice that Kabyle Text Cleaner is missing to clean some aspect of your extracted corpus. 

 

04 octobre 2025

Datasets and corpus in kabyle

 We know that there are people looking for some datasets in kabyle language for their projects, this is why we are publishing some of them via our community account on HuggingFace.

Imsidag community on HugginFace


 

    Some of these datasets are a parallel corpus and some are monolingual (kabyle only). We would like to emphasis that some datasets are not yet cleaned and published as is in purpose for people interested in building tools such as "fixers, cleaners, standardizers ..." for kabyle language.

    These datasets may help you to create and improve a kabyle spellchecker dictionary for example, word frequency analyzers, calculate n-grams, calculate syllable weight (CV), build word games from the datasets ... and so on.

    Please find them all on : https://huggingface.co/Imsidag-community/datasets 

Intelligence artificielle en kabyle

 Azul fell-awen·akent,

    Nous avons le plaisir de vous annoncer que nous participons à la traduction d'un projet qui se nomme OpenWebUI et ce en kabyle.

    OpenWebUI est un logiciel installable localement sur votre propre ordinateur et permet d’interagir ainsi avec des modèles génératifs localement que vous ayez besoin d'une connexion internet ou pas.

OpenWebUI est utilisable via un simple navigateur web. Une fois installé, rendez-vous dans vos paramètres et choisissez "Taqbaylit" comme langue d'interface.

Vidéo : https://www.youtube.com/watch?v=3G-FJEcmPC4


 Dépôt Git d'OpenWebUI : https://github.com/open-webui/open-webui 

08 septembre 2025

Tigzi taragmawant s teqbaylit

 L'expression "Intelligence artificielle" est traduite en kabyle par "tigzi taragmawant", selon le lexique informatique de Madame Samiya Saad Bouzefrane.

Agama en kabyle étant le mot utilisé pour désigner la "nature" dont est dérivé le mot "agmawan" signfiant "naturel". Accolé l'affixe de négation "ara" au mot "agmawan" celà donne l'adjectif aragmawan.

    Tout ceci pour dire que si l'intelligence humaine est naturelle, celle de la machine (même si faussement l'on accorde la qualité d'une intelligence à la machine) est "non-naturelle" et de fait "artificielle". 

    Comme nous avons remarqué que beaucoup d'utilisateurs et d'utilisatrices utilisent des interfaces ne prenant pas en charge Taqbaylit afin d’interagir avec certains modèles génératifs, nous avons pris l'initiative de traduire quelques logiciels et interfaces libres et ouvertes afin de permettre à tout un chacun de pouvoir disposer d’interfaces entièrement traduites et utilisables en kabyle.

  Notez que notre but n'est pas focalisé sur l’entraînement d'un modèle dit "d'intelligence artificielle" en kabyle mais bel et bien d'interfaces qui permettent de saisir les "prompts" dans le but de tester ou de discuter avec des modèles hébergés localement sur son propre ordinateur ou connectés à distance via API.

Le mot "prompt" se dit "aneftaɣ" (au pluriel : ineftaɣen), selon le lexique informatique cité plus haut.

A cet effet, et à ce jour, nous avons entamé la traduction des logiciels suivants en kabyle, en majorité utilisables sous GNU/Linux. Libre à vous de les tester, ou pas :

 Exemple d'interface d'OpenWebUI traduite en langue kabyle.
  
Agrudem n OpenWebUI s teqbaylit

    Pour l'instant, nous nous contentons d'utiliser l’abréviation anglaise "AI" mais si vous rencontrez l'expression "TT" ou équivalentes, cela signifie Tigzi Taragmawant. Certaines traductions exigent que l'on respecte le nombre maximal de caractères autorisés, par exemple sur « une barre de titre» d'un logiciel, l'expression Tigzi Taragmawant est longue, alors on utilise le mot d'origine "AI" afin de répondre à l'exigence.

Voici une autre capture du logiciel Alpaca disponible sur Flathub pour Linux :

Alpaca : Client de discussion avec un modèle génératif.

 Si vous avez des remarques ou des suggestions, n'hésitez pas à nous suivre ou à nous poser des question sur le réseau social Mastodon : https://mastodon.online/@kabyle


 

 

13 août 2025

Ecrire en kabyle sur le navigateur Mozilla Firefox

 Afin de simplifier aux utilisateurs et aux utilisatrices d'ordinateurs de saisir aisément au clavier et en kabyle certains caractères latins sur le Web, nous avons mit à leur disposition une extension pour le navigateur Mozilla Firefox.

Cette extension s'appelle : Kabyle Input Helper

 Il suffit d'installer le navigateur Mozilla Firefox puis d'aller sur la page de l'extension, disponible sur ce lien : https://addons.mozilla.org/kab/firefox/addon/kabyle-input-helper/

Un fois installée, vous pouvez vous rendre sur n'importe quelle web, exemple sur le moteur de recherche DuckDuckGo et commencer la saisie.

Kabyle Input Helper permet de saisir facilement les caractères suivants :

ẓ, ṛ, ṭ, ɛ, ɣ, ṣ, ḍ, ǧ, ḥ, č

Méthode de saisie des caractères

 La méthode de saisie sur les pages Web consiste à saisir une lettre suivie du le symbole = . Exemple : pour saisir un , il suffit de saisir un z sans laisser d'espace suivi du symbole égal =.

Pareil pour les autres lettres.

q= pour obtenir un ɣ

a= pour obtenir un ɛ 

g= pour obtenir un ǧ 

Autres extensions pour saisir en kabyle sur le Web 

Vous pouvez également utiliser l'extension développée par MediaWiki et qui porte le nom Wikimedia Input Tools : https://addons.mozilla.org/en-US/firefox/addon/wikimedia-input-tools/

La méthode de saisie en kabyle via Wikimedia Input Tools se repose sur l'usage sur tilde (~) avant un caractère. Elle est documentée sur ce lien. L'extension est également disponible sur le Chrome Web Store : https://chromewebstore.google.com/detail/wikimedia-input-tools/fjnfifedbeeeibikgpggddmfbaeccaoh?pli=1


 

06 avril 2025

Clavier kabyle en tamazight pour Android

    Je cherche un clavier Tamazight !

    Sur le web existent des applications de clavier annonçant prendre en charge la langue Kabyle. Les premiers à exprimer cette recherche d'un clavier latin (appelé également : clavier Tamazight "Tamɛemrit", car utilisant les caractères latins), sont les universitaires.

    On peut lire alors à travers les commentaires, des recommandations de claviers tels que : KeyBer ou encore GBoard (Google Keyboard, le clavier de Google) ou SwiftKey (de Microsoft); ceci dit on entend rarement parler des alternatives libres et ouvertes à celles que je viens de citer.

     Dans ce billet de blog, je vous parlerai des alternatives aux applications de clavier Amazigh déjà connues dans l'espoir de susciter votre curiosité à les essayer.

Les alternatives pour écrire en Tamɛemrit (latin)

Proposition d'une disposition de clavier kabyle pour Futo Keyboard.
 

Parmi ces applications alternatives de clavier, je citerai quelques unes, disponibles dès maintenant, en libre téléchargement :

Heliboard, Futo Keyboard et AnySoft Keyboard.

    Le présent article se concentre sur les dispositions de clavier dites latines, tel que vous l'aurez remarqué, cependant ces applications prennent en charge également la disposition du clavier Tamazight en script Tifinagh, pour des usages spécifiques : l'application AnySoft Keyboard permet de saisir en caractères Tifinaghs via un paquet de langue additionnel dédié.

Disposition « Tamazight Standard du Maroc" sur Futo Keyboard.

 

    La particularité de ces claviers par rapport aux autres c'est qu'ils sont libres et ouverts : c'est à dire que vous pouvez consulter le code source de ces applications et si vous trouvez une erreur dans le clavier, vous pouvez la signaler aux développeurs en ouvrant un ticket de bogue sur les forges logicielles dédiées aux projets, afin de les améliorer.

Quoiqu'il en soi, vous serez en mesure de saisir toutes les lettres spécifiques et les caractères requis pour écrire en kabyle. Cela inclut des caractères spéciaux tels que ẓ, ṛ, ṭ, ɛ, ɣ, ṣ, ḍ, ǧ, ḥ, č

Est-ce que ces claviers ont un correcteur ou un dictionnaire de suggestion de mots en kabyle / tamazight ?

    Certains claviers comme HeliBoard, vous permettent de créer et de personnaliser votre propre disposition de clavier directement sur l'appli sans attendre la sortie d'une nouvelle version.

Disposition en kabyle du clavier Heliboard avec des suggestions de mots sur la barre des suggestions

 

    Les claviers HeliBoard et Futo Keyboard vous permettent également de télécharger un dictionnaire des mots les plus fréquemment utilisés en kabyle et de vous proposer des suggestions de mots sur la barre dédiée à cet effet. (voir l'illustration ci-dessus)

Bien que ce dictionnaire n'est pas exhaustif, vous pouvez ajouter vos propres mots au dictionnaire personnel.

Dictionnaire de suggestion de mots en kabyle utilisable sur HeliBoard ainsi que sur Futo Keyboard.

 

D'autres projets prendront également en charge la saisie en kabyle / tamazight à l'image de FlorisBoard mais celà va être le sujet d'un prochain article.

Si vous êtes impatient, vous pouvez tester FlorisBoard dans d'autres langues, pour l'instant en visitant : https://florisboard.org/

A contrario des autres apps de clavier qui profitent de l'ignorance des utilisateurs et des utilisatrices, les applications alternatives citées dans le présent article ne transmettent aucune donnée à un service tiers : votre saisie textuelle vous appartient à vous et à vous uniquement car la protection de la vie privée est un élément important dans ce monde où la marchandisation de nos données personnelles et devenue monnaie courante.

Dans le doute, consultez les paramètres du clavier Gboard de votre téléphone et désactivez le partage de votre saisie avec votre « ami » Google ou demandez à l'un de vos proches de le faire pour vous.

Paramètres de confidentialité du clavier Gboard de Google.

 

Il est cependant bon de rappeler qu'il est nécessaire d'éviter de télécharger des fichiers APK brutes qui pullulent sur le web en dehors des indexes d'apps connus et de confiance. F-Droid est reconnu pour ses critères stricts concernant l'inclusion de logiciels libres et open source, offrant aux utilisateurs un certain niveau de confiance et de transparence.

Si vous avez des remarques, des critiques ou des suggestions à propos des dispositions de clavier en kabyle, vous pouvez me suivre sur le réseau social Mastodon et suivre également Kabyle In FLOSS parce-que oui, ce blog est également présent sur le fédiverse.

03 avril 2025

Name of days of the week in Kabyle language

Here is how we name the days of the week in Kabyle language according to the Berber Academy :

(Formal forms used in education, school and university)

Monday - Arim

Tuesday - Aram

Wednesday - Ahad

Thursday - Amhad

Friday - Sem

Saturday - Sed

Sunday - Acer

These names can be found on glibc library.

In Debian for example, glibc 2.41-6 : https://sources.debian.org/src/glibc/2.41-6/localedata/locales/kab_DZ/

You can read the history of the ticket here :  https://sourceware.org/bugzilla/show_bug.cgi?id=18812

On the ScriptSource website, there is a webpage called :  Names of Months and Days in Kabyle where it is mentionned :

Days

Sunday: Acer
Monday: Arim
Tuesday: Aram
Wednesday: Ahad
Thursday: Amhad
Friday: Sem
Saturday: Sed
 

However, kabyle people still use (borrowed forms) in daily life :

Monday - Letnayen
Tuesday - Ttlata
Wednesday - Laṛebɛa
Thursday - Lexmis
Friday - Lǧemɛa
Saturday - Ssebt
Sunday - Lḥedd

    It is recommend to use, always, the (formal forms) as a standard in calendar software when it comes to translate software to kabyle language.

     This page will be update soon with more documentation : kabyle translators and localizers where notified to provide more documentation.

01 avril 2025

Traduction en Kabyle

 Traduction en Kabyle

Sur le web il existe peu de projets et de services qui permettent la traduction de et vers la langue kabyle. Et par traduction, je désigne traduction automatique.

Les quelques articles qui en parlent ne citent que Google ayant introduit Tamazight dans Google Translate ainsi que de Tasuqilt (plateforme de traduction automatique en Tamazight) mais rares ceux qui parlent de LibreTranslate.

Mais qu’est-ce donc LibreTranslate ?

Dans cet article, je vais vous parler alors de LibreTranslate.

LibreTranslate n'est pas uniquement un simple site web de traduction mais une plateforme API ouverte de traduction automatique.

 Tout comme n'importe quel logiciel à code source ouvert, n'importe qui peut consulter le code de LibreTranslate hébergé sur Git, l'étudier et l'améliorer avec de nouvelles contributions.

Est-ce qu'il y a une demande pour les services de traduction en kabyle ?

Il faut savoir qu'il y a une forte demande de la part des utilisateur·rice·s kabylophones en matière de plateformes de services de traduction, une demande longtemps ignorée par certains acteurs; les dictionnaires web en tamazight éparpillés par-ci et par-là ne suffisaient pas à combler cette demande croissante. Bien que ressource importante, ces dictionnaires n'offraient que des traductions de mots, loin des traductions de phrases entières.

Cette demande se caractérise essentiellement à travers l'ouverture de pétitions sur le web auxquelles il n'y avait généralement aucun écho à l'image des nombreuses pétitions qui étaient destinées à Google Translate (et je vous laisse chercher).

Ceci dit, les utilisateur·rice·s ont très bien accueillis la naissance sur le Web d'une plateforme de traduction automatique développée par la diaspora Kabyle établie au Canada. Une plateforme portant le nom de Tasuqilt.

Il faut savoir qu'en Algérie, il est difficile d'avoir une nom de domaine en .dz pour travailler sur un projet de type collaboratif et par la même occasion créer une communauté autour.

Comme j'ai noté que Tasuqilt utilisait essentiellement les phrases produites par la communauté kabyle sur Tatoeba (en d'autre termes sur un corpus crowdsourcé), j'ai alors tenté un appel à contribution dans le forum de la comunauté LibreTranslate le 11 janvier 2024.

Et c'est là que la magie opère en public et je vous invite à lire le fil dédié en cliquant ici.

 Puis-je utiliser LibreTranslate pour traduire de et vers le kabyle ?

Je suppose donc que tu as lu le fil publié sur forum en haut et que tu sais désormais qu'un membre de la communauté LibreTranslate a entraîné deux modèles de traduction en Kabyle : l'un en février 2024 et l'autre plus amélioré en mars 2024.

Google quant à lui n'a annoncé l'intégration de Tamazight au service Google Translate qu'en juin 2024, à travers son blog.

Réponse courte à la question posée dans ce titre : Oui, il est tout à fait possible d'utiliser LibreTranslate afin de traduire, non pas des mots, non pas des phrases, non pas des paragraphes uniquement mais même des fichiers grâce à LibreTranslate.

Interface Web de traduction de LibreTranslate.

Et peut-on traduire uniquement du français vers le kabyle sur LibreTranslate ?

Excellente question ! Justement, LibreTranslate permet de traduire à partir de plusieurs langues vers le kabyle et inversement : on peut traduire du Slovaque, du Chinois, de l'Estonien ... vers le kabyle et du kabyle vers ... le norvégien, le japonnais, le basque et l'ourdou !

A échelle de comparaison, le service web de Tasuqilt ne permet la traduction qu'entre 4 (quatre) couples de langues : l'arabe, l'anglais, le français et le kabyle (tamaziɣt).

LibreTranslate sans connexion Internet 

Ce qui fait la particularité de LibreTranslate c'est la possibilité offerte aux utilisateur·rice·s d'héberger eux-mêmes LibreTranslate sur leur propre ordinateur en local et effectuer des tâches de traduction localement sans transmettre de données vers un acteur tiers sur le Web.

C'est à dire que n'importe qui (ayant les compétences nécessaires) peut télécharger LibreTranslate, installer les modèles de langues souhaités et l'utiliser tout en débranchant son câble réseau et son accès Wi-Fi.

Qu'en est-il de la traduction en kabyle en elle-même sur LibreTranslate ?

Grâce au modèle de traduction kabyle de LibreTranslate, bien que imparfait et améliorable à l'avenir, LibreTranslate peut générer des traductions alternatives et accorder des points de confiance aux traductions.

Par exemple, "Hello everyone !" de l'anglais vers le kabyle sera traduite via LibreTranslate par : "Azul fell-awen meṛṛa!"

Ceci dit, des traductions alternatives sont proposées à l'utilisateur·rice via l'API de LibreTranslate dont voici un échantillon :

  • Azul fell-awen akken ma tellam!
  • Azul fell-awen akk!
  • Azul fell-awen merra!


 

Si à ce stade, tu as trouvé cet article intéressant et que tu pense que tu as appris des choses en le lisant et tu voudrais en savoir plus, tu peux me retrouver sur le réseau social Mastodon et découvrir les projets auxquels nous contribuons; "nous", parce-que nous sommes une petite communauté de volontaires et de contributeur·rice·s qui essaient de faire des choses :)

Mastodon : https://mstdn.fr/@ButterflyOfFire

Merci encore à la communauté LibreTranslate et à LynxPDA pour sa précieuse contribution. Merci également à Moonshadow et à Azwaw pour leurs traductions.

29 mars 2025

Clavier Kabyle sous Linux


Clavier Kabyle - Tamazight

 Il existe plusieurs méthodes de saisie au clavier et en kabyle sous Linux.

Parmi ces méthodes d'entrées, on va citer les plus couramment utilisées et qui sont à base de la disposition de clavier dite "AZERTY".

Sur Fedora Linux, par exemple, on retrouve les dispositions de clavier "Berber (Algeria, Latin)" et "Kabyle (AZERTY, with dead keys)".

Voici un petit aperçu des paramètres du clavier sous GNOME :

 

Méthodes de saisie au clavier sous Fedora Linux.

Accès aux caractères latins de l'alphabet kabyle / Tamazight

En sélectionnant la disposition de clavier "Berber (Algeria, Latin)"


 Il faut savoir que les caractères latins permettant de saisir du texte en kabyle sont mentionnés dans le CLDR d'Unicode comme ceci : / abcčdḍeɛfgǧɣhḥijklmnpqrṛsṣtṭuwxyzẓ / avec optionnellement les caractères [o v] s'agissant des mots empruntés.

Généralement, les utilisateur·rice·s cherchent une manière pour pouvoir saisir les caractères suivants / čḍɛǧɣḥṛṣṭẓ / et ce lors de la rédaction de textes en Kabyle / Tamaziɣt.



 

A travers la disposition Berber (Algeria, Latin), l'opération est généralement facile et n'engage que la touche AltGR :

č = AltGR+c

ḍ = AltGR+d

ɛ = AltGR+o

ǧ = AltGR+g

ɣ = AltGR+v

ḥ = AltGR+h

ṛ = AltGR+r

ṣ = AltGR+s

ṭ = AltGR+t

ẓ  = AltGR+z

La seconde méthode, étant plus élaborée, c'est en sélectionnant la disposition de clavier dite "Kabyle (AZERTY, with dead keys)". Cette disposition introduit une nouvelle manière de saisie impliquant 3 (trois) ou 4 (quatre) touches.

č = AltGR+Shift maintenues + % + c

ḍ = AltGR+;+d

ɛ = AltGR+a

ǧ = AltGR+Shift maintenues + % + g

ɣ = AltGR+q

ḥ = AltGR+;+h

ṛ = AltGR+;+r

ṣ = AltGR+;+s

ṭ = AltGR+;+t

ẓ  = AltGR+;+z 

Remarque importante : certains utilisateur·rice·s ne savent pas de quelle touche "point" s'agit-il. Le point à utiliser avec la touche AltGR n'est pas celui qui se trouve dans le pavé numérique mais bel et bien le point représenté par la touche "point virgule" .

Quant au script tifinagh (tifinaɣ), utilisé à titre symbolique, il suffit tout simplement d'installer la disposition de clavier Berber (Algeria, Tifinagh).


Disposition de clavier Tifinagh sous Fedora Linux.

Petite démonstration en vidéo :

https://peertube.mesnumeriques.fr/w/i7WYo5aCk3crPbyGdLRHst

Si vous avez des questions, vous pouvez me suivre sur le réseau social Mastodon.

Fedora Linux 44 teffeɣ-d

 Ihi anagraw n wammud Fedora Linux 44 yeffeɣ-d ass-a. Aseɣwen : https://fedoraproject.org/kab/workstation/  Fedora Linux 44  Fedora Workstat...

Mastodon