Unixová legenda, která nám nic nedluží, nadále opravuje základní kód AWK
Profesor z Princetonu, který si našel chvilku pro sebe v letním akademickém klidu, poslal před pár měsíci e-mail starému příteli. Brian Kernighan pozdravil, zeptal se, jak probíhá jejich návštěva v USA, a poslal stovky řádků kódu , které by mohly přidat podporu Unicode do AWK, nástroje pro analýzu textu, který pomáhal vybudovat pro Unix v Bell Labs v roce 1977.
„Otestoval jsem to docela dost, ale je jasné, že je potřeba další testování,“ napsal Kernighan v e-mailu, který dlouholetý správce Arnold Robbins zaslal jako jakýsi pseudozávazek k repozitáři onetrueawk. „Jakmile zjistím jak… zkusím odeslat žádost o stažení.“ Přál bych si, abych git lépe porozuměl, ale i přes vaši pomoc stále nemám správné porozumění, takže to může chvíli trvat.“
Kernighan je „K“ v AWK , speciálním extrakčním a řídicím jazyku, který byl klíčem k funkcím unixového potrubí a interoperabilitě mezi systémy. Běžící awk
funkce (AWK je jazyk, awk
příkaz k jeho volání) je kritická jak pro specifikaci standardu UNIX, tak pro certifikaci IEEE POSIX z hlediska interoperability. Existuje nespočet variant awk
, ale „One True AWK“, někdy známé jako nawk
, je verze založená na Kernighanově knize The AWK Programming Language z roku 1985 a jejím následným vstupem.
Kernighan je také „K“ v „K&R C“, klíčové knize The C Programming Language z roku 1978, kterou napsal společně s Dennisem Ritchiem a která zůstává u programátorů, mentálně a ve formě otlučeného papíru. Kořeny Xi sahají mnohem hlouběji. Kernighan vyškolil C v Bell Labs a přesvědčil jejího tvůrce Dennise Ritchieho, aby spolupracoval na knize k šíření znalostí. Tato kniha zplodila „jediný skutečný styl složených závorek“, nekonečnou debatu, která se s ní pojí, a strukturu, která je základem každého moderního programovacího jazyka.
Kernighan také pojmenoval Unix a jako první předvedl příklad kódu „Ahoj, světe“. Hovořil s Richardem Jensenem z Ars Technica o 50 letech historie Unixu.
Úložiště onetrueawk, kde se Kernighan objevil na konci května, je relativně klidné místo s 21 přispěvateli, 46 uživateli GitHubu, kteří ho sledují, a závazky se objevují každých pár měsíců. Jak poznamenal The Register , Kernighanova oprava Unicode se stala známou hlavně proto, že byla zmíněna v rozhovoru s profesorem na YouTube kanálu Computerphile .
„Vždy bylo trapné, že AWK pracuje pouze s ASCII nebo možná 8bitovým vstupem, ale ve skutečnosti vůbec nezvládá Unicode,“ řekl Kernighan tazateli profesoru Balesfordovi. „Před několika měsíci jsem strávil nějaký čas prací (smích) s neuvěřitelně starým programem. Momentálně ho mám, kde ve skutečnosti zpracovává vstup a výstup UTF-8, takže můžete mít regulární výrazy, které, víte, přebírají japonské znaky a podobně.“
Kernighan, kterému je nyní 80 let, v rozhovoru mimoděk zmiňuje, že také opravil něco „rychlého a špinavého“, aby AWK mohl zpracovávat soubory CSV.
Napsat komentář