Crëwyd y geiriadur bach yma, y cyntaf erioed ar y We, trwy gyfuno Eurfa, y geiriadur rhydd Cymraeg, â rhestr geiriau Cernyweg a roed at ei gilydd gan Paul Bowden.

Mae'r geiriadur yn cynnwys tua 4,000 gair, a chymerodd 'mond ryw 5 awr i'w wneud, gan fod y data ar gael o dan drwydded rhydd. Dengys sut y gall rhannu data fel hyn arwain at gymwysiadau arloesol newydd i ieithoedd lleiafrifol (gweler hefyd Implementing NLP Projects for Non-Central Languages, gan Streiter, Scannell a Stuflesser, a The language belongs to the People! gan Koster a Gradman). Er ei bod hi'n bosibl chwilio am air yn y dau gyfeiriad, Cernyweg yw'r iaith gynradd, felly mae canlyniadau chwilio am air Gymraeg yn llai daclus!

Mae Eurfa yn cynnwys bron i 13,000 gair, a'u gasglwyd o'r We, cyhoeddiadau gan gyrff cyhoeddus yng Nghymru, cylchgronau, ac ati. Y bwriad yw creu rhestr wedi'i thagio o eiriau Cymraeg a ellir ei ddefnyddio yn rhydd mewn rhaglenni Cymraeg eraill (e.e. y fersiwn Cymraeg o wirydd gramadeg Kevin P Scannell, An Gramadóir - gweler Klebran).

Mae'r rhestr Gernyweg yn cynnwys tua 10,000 gair a'u gasglwyd â llaw o amrywiaeth o ffynonellau, yn cynnwys system cyfieithu gan beiriant a ddatblygwyd gan Paul Bowden (gweler e.e. Building a Lexicon for a Kernewek MT System ac A Cornish to English MT System). Oherwydd natur y gwaith, mae mwy o eiriau o ddechrau yr wyddor nag o'r diwedd.

Dr. Paul R. Bowden (paul.bowden-curly_a-ntu(period-ac)(period-uk): Darlithiwr Uwch a Tiwtor Blwyddyn Gyntaf, Ysgol Cyfrifiadureg ac Hysbyseg, Prifysgol Nottingham Trent, gyda diddordeb arbennig yn ieithyddiaeth cyfrifiadurol a chyfieithu gan beiriant.
Dr Kevin Donnelly (kevin-curly_a-dotmon(period-com): Datblygwr meddalwedd rhydd, gyda diddordeb arbennig ym maes ieithyddiaeth.