Unix leģenda, kas mums neko nav parādā, turpina labot pamatā esošo AWK kodu

Unix leģenda, kas mums neko nav parādā, turpina labot pamatā esošo AWK kodu

Prinstonas profesors, vasaras akadēmiskajā mierā atradis laiku sev, pirms pāris mēnešiem nosūtīja e-pastu senam draugam. Braiens Kernigans sasveicinājās, jautāja, kā norit viņu vizīte ASV, un nosūtīja simtiem koda rindiņu , kas varētu pievienot Unicode atbalstu AWK — teksta analīzes rīkam, ko viņš palīdzēja izveidot Unix uzņēmumam Bell Labs 1977. gadā.

“Esmu to pārbaudījis diezgan daudz, taču nepārprotami ir vajadzīgas papildu pārbaudes,” Kernigans rakstīja e-pastā, ko kā sava veida pseidoapņemšanos onetrueawk repozitorijā ievietojis ilggadējais uzturētājs Arnolds Robins. “Kad es izdomāšu, kā… es mēģināšu iesniegt izvilkšanas pieprasījumu. Es vēlos, lai es varētu labāk saprast gitu, taču, neskatoties uz jūsu palīdzību, man joprojām nav pareizās izpratnes, tāpēc tas var aizņemt kādu laiku.

Kernighan ir “K” AWK — īpašam nolūkam paredzēta ekstrakcijas un vadības valoda, kas bija atslēga Unix konveijera funkcijām un sistēmu savietojamībai. Darbīga awkfunkcija (AWK ir valoda, awkkomanda, lai to izsauktu) ir būtiska gan UNIX standarta specifikācijai, gan IEEE POSIX sertifikācijai sadarbspējas ziņā. Ir neskaitāmi varianti awk, taču “One True AWK”, dažkārt pazīstams arī kā nawk, ir versija, kuras pamatā ir Kernigana 1985. gada grāmata The AWK Programming Language un tās turpmākā ievade.

Kernighan ir arī “K” grāmatā “K&R C”, nozīmīgākajā 1978. gada grāmatā C programmēšanas valoda, kuru viņš sarakstīja kopā ar Denisu Ričiju un kura paliek programmētājiem garīgi un sagrauta papīra formā. Sji saknes sniedzas daudz dziļāk. Kernighan apmācīja C Bell Labs un pārliecināja tās veidotāju Denisu Ričiju sadarboties grāmatas izstrādē, lai izplatītu zināšanas. Šī grāmata radīja “vienīgo patieso lenču stilu”, ar to saistītās nebeidzamās debates un struktūru, kas ir katras mūsdienu programmēšanas valodas pamatā.

Kernighan arī nosauca Unix un bija pirmais, kas demonstrēja “Hello, world” koda piemēru. Viņš runāja ar Ričardu Jensenu no Ars Technica par 50 gadu Unix vēsturi.

Onetrueawk repozitorijs, kurā Kernighan parādījās maija beigās, ir salīdzinoši klusa vieta, kurā ir 21 līdzautors, 46 GitHub lietotāji, ko skatās, un saistības tiek parādītas ik pēc dažiem mēnešiem. Kā atzīmēja The Register , Kernighan Unicode labojums kļuva zināms galvenokārt tāpēc, ka tas tika minēts intervijā ar profesoru Computerphile YouTube kanālā .

“Vienmēr ir bijis neērti, ka AWK darbojas tikai ar ASCII vai varbūt 8 bitu ievadi, bet īsti neapstrādā Unicode,” Kernigans sacīja intervētājam profesoram Balesfordam. “Pirms dažiem mēnešiem es kādu laiku pavadīju, strādājot (smejas) ar neticami vecu programmu. Pašlaik man tas ir, kur tas faktiski apstrādā UTF-8 ievadi un izvadi, lai jūs varētu izmantot regulāras izteiksmes, kas, jūs zināt, uztver japāņu rakstzīmes un citas lietas.

Kernighan, kuram tagad ir 80, intervijā nejauši piemin, ka viņš arī salaboja kaut ko “ātri un netīru”, lai ļautu AWK apstrādāt CSV failus.

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *