Unix-legenda, joka ei ole meille mitään velkaa, korjaa edelleen taustalla olevaa AWK-koodia
Princetonin professori, joka löysi aikaa itselleen kesän akateemisesta tauosta, lähetti pari kuukautta sitten sähköpostin vanhalle ystävälleen. Brian Kernighan tervehti, kysyi, kuinka heidän Yhdysvaltain-vierailunsa sujui, ja lähetti satoja koodirivejä , jotka voisivat lisätä Unicode-tuen AWK:hen, tekstianalyysityökaluun, jota hän auttoi rakentamaan Unixille Bell Labsissa vuonna 1977.
”Olen testannut tätä melko vähän, mutta lisää testausta tarvitaan selvästi”, Kernighan kirjoitti sähköpostissa, jonka pitkäaikainen ylläpitäjä Arnold Robbins lähetti eräänlaisena pseudo-sitoumuksena onetrueawk-tietovarastoon. ”Kun saan selville, kuinka… yritän lähettää vetopyynnön. Toivon, että voisin ymmärtää gittiä paremmin, mutta avustasi huolimatta minulla ei vieläkään ole oikeaa ymmärrystä, joten se voi kestää hetken.”
Kernighan on ”K” AWK: ssa , erikoiskäyttöisessä purku- ja ohjauskielessä, joka oli avain Unix-liukuhihnatoimintoihin ja järjestelmien yhteentoimivuuteen. Käynnissä oleva awk
ominaisuus (AWK on kieli, awk
komento sen kutsumiseksi) on kriittistä sekä UNIX-standardin spesifikaatiolle että IEEE POSIX -sertifioinnille yhteentoimivuuden kannalta. On olemassa lukemattomia muunnelmia awk
, mutta ”One True AWK”, joka tunnetaan myös nimellä nawk
, on Kernighanin vuoden 1985 kirjaan The AWK Programming Language ja sen myöhempään syötteeseen perustuva versio.
Kernighan on myös ”K” K&R C:ssä, vuonna 1978 ilmestyneessä merkittävässä kirjassa The C-ohjelmointikieli, jonka hän kirjoitti yhdessä Dennis Ritchien kanssa, ja joka pysyy ohjelmoijien keskuudessa, henkisesti ja kolaroidussa paperimuodossa. Xin juuret ulottuvat paljon syvemmälle. Kernighan koulutti C:tä Bell Labsissa ja sai sen luojan Dennis Ritchien tekemään yhteistyötä tiedon levittämiseksi. Tämä kirja synnytti ”ainoan todellisen aaltosulkeetyylin”, sen mukana kulkevan loputtoman keskustelun ja jokaisen modernin ohjelmointikielen rakenteen.
Kernighan nimesi myös Unixin ja esitti ensimmäisenä ”Hei, maailma” -koodiesimerkin. Hän puhui Ars Technican Richard Jensenin kanssa Unixin 50 vuoden historiasta.
Onetrueawk-arkisto, johon Kernighan ilmestyi toukokuun lopulla, on suhteellisen hiljainen paikka, jossa on 21 kirjoittajaa, 46 GitHub-käyttäjää katselemassa ja sitoumuksia ilmestyy muutaman kuukauden välein. Kuten The Register totesi , Kernighanin Unicode-korjaus tuli tunnetuksi pääasiassa siksi, että se mainittiin professorin haastattelussa Computerphilen YouTube-kanavalla .
”On aina ollut noloa, että AWK toimii vain ASCII:n tai ehkä 8-bittisen tulon kanssa, mutta ei oikeastaan käsittele Unicodea ollenkaan”, Kernighan kertoi haastattelija professori Balesfordille. ”Muutama kuukausi sitten vietin jonkin aikaa työskennellen (nauraa) uskomattoman vanhan ohjelman parissa. Minulla on tällä hetkellä se, jossa se todella käsittelee UTF-8-tuloa ja -tulostusta, joten sinulla voi olla säännöllisiä lausekkeita, jotka poimivat japanilaisia merkkejä ja muuta.”
Kernighan, nyt 80, mainitsee sattumalta haastattelussa, että hän myös korjasi jotain ”nopeaa ja likaista”, jotta AWK voi käsitellä CSV-tiedostoja.
Vastaa