BUNADAS – Beatha Ùr don Stòr-fhaclan Co-dhàimheil Ceilteach

le Caoimhín Ó Donnaíle

gearr-iomradh air pàipear dhan cho-labhairt Rannsachadh na Gàidhlig 2016

Tha am pàipear seo aʼ cur an cèill Bunadas, goireas fosgailte ùr air an Eadar-lìon. Coltach ris an Stòr-fhaclan Co-dhàimheil Ceilteach roimhe, tha Bunadas na stòr-dàta de dhʼfhacail bho iomadh cànan, agus bidh e aʼ dèanamh cheanglaichean eadar facail a tha càirdeach ri chèile a thaobh freumh-fhaclachd. Ach eu-coltach ris an Stòr-fhaclan Co-dhàimheil Ceilteach, air a bheil structar righinn ceàrnagach neo-shùbailte do-leasaichte, tha structar innleachdach lìonraidh ùr aig Bunadas. Bidh seo aʼ leigeil dha fàs gu furasta, le bhith aʼ tàthadh stòran-dàta eile ris fhèin. Agus, gu dearbh, le bhith aʼ tàthadh nan obraichean aig diofar sgiobaidhean, dh’fhaodadh Bunadas fàs na stòr-dàta freumh-fhaclachd do na cànanan Ind-Eòrpach gu lèir. Nochdaidh e na ceanglaichean eadar càraid chànan sam bith, a chum tairbhe luchd-ionnsachaidh agus luchd-rannsachaidh ar-aon.

Thionnsgnaich an t-ùghdar an Stòr-fhaclan Co-dhàimheil Ceilteach (an Celtic Cognates Database) barrachd is deich bliadhna air ais. Chaidh a chur an cèill aig co-labhairt NAACLT 2000 ann an Luimneach, agus chaidh a thogail sna beagan bhliadhnaichean an dèidh sin le beagan taic-airgid bho Cholmcille. Tha e ann fhathast agus tha e feumail fhathast. Bhon uair sin, ge-tà, chaidh ceanglaichean ri Multidict, an siostam de dhʼfhaclairean iol-chànanach, a chur ris an eadar-aghaidh aige agus thug sin piseach air. Ach cha deach idir cur ris an stòras fhèin sna deich bliadhnaichean a chaidh seachad, ged a bha càirn mhòra de cheanglaichean, mar eisimpleir ris an t-Sean Ghàidhlig, aʼ feitheamh rin cur ris. Oir tha structar righinn aig an stòr-dàta, le aon chlàr ceàrnagach, m.e.

gd ga gv cy kw br
bliadhna bliain blein blwyddyn blydhen bloavezh
cuid cuid cooed peth pyth pezh

Agus dhʼfhàg sin gur e obair chianail dhoirbh a bhiodh innte stòran-dàta eile a choimeasgadh ris.

Tha structar gu tur eadar-dhealaichte aig Bunadas, structar fada nas adhartaiche, taing do na goireasan gleusta prògramaidh coimpiutaireachd a thʼ ann an-diugh. Tha poit mhòr de dhʼfhaclan ann, gach aon air a chomharrachadh le cànan. Agus an uair sin tha ‘buidhnean’ ann (no dhʼfhaodamaid ‘nodes’ no ‘drongan’ a chanail riutha) a bhios aʼ sònrachadh grunnan fhaclan a tha càirdeach ri chèile. An rud a tha glic, ’s e gun urrainn don phrògram siubhal leis fhèin air an lìonradh sin − bho fhacal gu buidhinn, gu facal, gu buidhinn eile, gu facal eile − agus, anns an dòigh sin, ceanglaichean fad-às a dhèanamh. Ma bhios na buidhnean a leanas ann

{ bliadain (sga), bliain (ga) }
{ bliadhna (gd), bliadhnail (gd), bliain (ga), blein (gv) }
{ bliadhna (gd), blwyddyn (cy) }
{ blwyddyn (cy), blydhen (kw), bloavezh (br) }

is urrainn do Bhunadas an cleachdadh gus ceangal a dhèanamh, mar eisimpleir, eadar Sean-Ghàidhlig bliadain agus Breatannais bloavezh.

Tha 36,000 facal gu ruige seo ann am Bunadas, an taca ri 9000 san Stor-fhaclan Co-dhaimheil Ceilteach. Bheirear iomradh sa phàipear air gnèithean structair eile ann am Bunadas, na h-adhbharan air an son, agus na planaichean leasachaidh a tha romhainn.

2016-03-06 CPD