우리에게 빚진 것이 없는 Unix 전설은 계속해서 기본 AWK 코드를 수정합니다.
여름 학업 소강 상태에서 자신을 위한 시간을 찾은 Princeton 교수는 몇 달 전에 오랜 친구에게 이메일을 보냈습니다. Brian Kernighan은 인사를 하고 미국 방문이 어떻게 진행되고 있는지 묻고 1977년 Bell Labs에서 Unix용으로 빌드하는 데 도움을 준 텍스트 분석 도구인 AWK에 유니코드 지원을 추가할 수 있는 수백 줄의 코드를 보냈습니다.
“나는 이것을 꽤 많이 테스트했지만 분명히 더 많은 테스트가 필요 합니다 . “방법을 알게 되면… 풀 리퀘스트를 제출해 보겠습니다. git을 더 잘 이해할 수 있으면 좋겠지만, 당신의 도움에도 불구하고 여전히 올바른 이해가 없기 때문에 시간이 걸릴 수 있습니다.”
Kernighan 은 Unix 파이프라인 기능과 시스템 간 상호 운용성의 핵심인 특수 목적 추출 및 제어 언어인 AWK 의 “K”입니다 . 실행 awk
기능(AWK는 언어, awk
이를 호출하는 명령)은 상호 운용성 측면에서 UNIX 표준 사양과 IEEE POSIX 인증 모두에 중요합니다. 에는 셀 수 없이 많은 변형이 있지만 awk
라고도 알려진 “One True AWK”는 nawk
Kernighan의 1985년 저서 The AWK Programming Language 및 후속 입력을 기반으로 하는 버전입니다.
Kernighan은 또한 “K&R C”의 “K”이기도 합니다. 그는 1978년 그가 Dennis Ritchie와 공동 집필한 The C Programming Language라는 중요한 책을 썼는데, 이 책은 정신적으로나 낡은 종이 형태로 프로그래머들과 함께 남아 있습니다. Xi의 뿌리는 훨씬 더 깊습니다. Kernighan은 Bell Labs에서 C를 교육했으며 제작자 Dennis Ritchie가 책을 공동으로 작성하여 지식을 전파하도록 설득했습니다. 이 책은 “유일한 진정한 중괄호 스타일”, 그에 따른 끝없는 논쟁, 모든 현대 프로그래밍 언어를 뒷받침하는 구조를 낳았습니다.
Kernighan은 또한 Unix라는 이름을 지정했으며 “Hello, world” 코드 예제를 최초로 시연했습니다. 그는 Ars Technica의 Richard Jensen과 약 50년의 Unix 역사에 대해 이야기했습니다.
Kernighan이 5월 말에 등장한 onetrueawk 리포지토리는 21명의 기여자, 46명의 GitHub 사용자가 지켜보는 비교적 조용한 곳이며 커밋은 몇 달마다 나타납니다. The Register 에서 언급했듯이 Kernighan의 유니코드 수정 프로그램은 주로 Computerphile의 YouTube 채널 에서 교수와의 인터뷰에서 언급되었기 때문에 알려졌습니다 .
“AWK가 ASCII 또는 아마도 8비트 입력으로만 작동하고 실제로 유니코드를 전혀 처리하지 않는다는 것은 항상 부끄러운 일이었습니다.”라고 Kernighan은 면접관인 Balesford 교수에게 말했습니다. “몇 달 전에 나는 믿을 수 없을 정도로 오래된 프로그램으로 작업하는 데 시간을 보냈습니다(웃음). 실제로 UTF-8 입력 및 출력을 처리하는 순간에 가지고 있으므로 일본어 문자 등을 선택하는 정규식을 가질 수 있습니다.”
현재 80세인 Kernighan은 인터뷰에서 AWK가 CSV 파일을 처리할 수 있도록 “빠르고 더러운” 무언가를 수정했다고 무심코 언급했습니다.
답글 남기기