구글 검색 API를 이용해서 토익 문제를 푸는 간단한 프로그램을 만들어 보았습니다.
대상이 되는 문제 유형은 다음과 같은 형태입니다.
로직은 이렇습니다.
A, B, C, D 보기를 빈칸에 채워 놓고 주변 단어(context words)를 포함해서 구검색(phrase search) 쿼리를 만들어, 구글 API로 검색을 합니다. 검색 결과 개수가 제일 많은 보기를 답으로 택하는 방법입니다. 결과 개수가 없거나 기준 보다 적으면 주변 단어 개수(context size)를 하나씩 줄여 가면서 구검색 쿼리를 다시 만듭니다. 실행 모습은 다음과 같습니다.
김대균 토익 450제에서 문제 100개를 선정해서 프로그램을 돌려봤습니다.
성적이 무려
75점
이 나왔습니다. 대단한 성적입니다.(네네~~ 제 기준으로 그렇단 말입니다.)
실행 과정에서 재미있는 사실을 하나 더 볼 수 있는데요.
정답인 (B) 이외에도 (A), (C) 등의 틀린 표현도 실제 웹 문서에서는 많이 쓰이고 있습니다. 정답을 못맞춘 경우는 프로그램이 제 역할을 못한 셈 치고 빼버리고, 정답을 맞춘 문제에서만 봐도 검색 결과의 약 21%는 틀린 보기의 표현이 웹문서에서 실제로 출현하고 있었습니다. 월드와이드웹의 토익점수는 79점이라고 봐야 겠군요.
대상이 되는 문제 유형은 다음과 같은 형태입니다.
Shirley will be transferred to the LA office as soon as an opening there _____________ available.
(A) becomes
(B) will become
(C) became
(D) have become
(A) becomes
(B) will become
(C) became
(D) have become
로직은 이렇습니다.
A, B, C, D 보기를 빈칸에 채워 놓고 주변 단어(context words)를 포함해서 구검색(phrase search) 쿼리를 만들어, 구글 API로 검색을 합니다. 검색 결과 개수가 제일 많은 보기를 답으로 택하는 방법입니다. 결과 개수가 없거나 기준 보다 적으면 주변 단어 개수(context size)를 하나씩 줄여 가면서 구검색 쿼리를 다시 만듭니다. 실행 모습은 다음과 같습니다.
문제 : Shirley will be transferred to the LA office as soon as an opening there _____________ available.
보기 :
(A) becomes
(B) will become
(C) became
(D) have become
...(중략)...
-------------------------------------
context size: 3
query : "opening there becomes available." : 검색결과: 0건
query : "opening there will become available." : 검색결과 : 0건
query : "opening there became available." : 검색결과 : 0건
query : "opening there have become available." : 검색결과 : 0건
-------------------------------------
context size : 2
query : "there becomes available." : 검색결과 : 1390건
query : "there will become available." : 검색결과 : 42건
query : "there became available." : 검색결과 : 608건
query : "there have become available." : 검색결과 : 202건
정답 : (A)
보기 :
(A) becomes
(B) will become
(C) became
(D) have become
...(중략)...
-------------------------------------
context size: 3
query : "opening there becomes available." : 검색결과: 0건
query : "opening there will become available." : 검색결과 : 0건
query : "opening there became available." : 검색결과 : 0건
query : "opening there have become available." : 검색결과 : 0건
-------------------------------------
context size : 2
query : "there becomes available." : 검색결과 : 1390건
query : "there will become available." : 검색결과 : 42건
query : "there became available." : 검색결과 : 608건
query : "there have become available." : 검색결과 : 202건
정답 : (A)
김대균 토익 450제에서 문제 100개를 선정해서 프로그램을 돌려봤습니다.
성적이 무려
75점
이 나왔습니다. 대단한 성적입니다.(네네~~ 제 기준으로 그렇단 말입니다.)
실행 과정에서 재미있는 사실을 하나 더 볼 수 있는데요.
문제 : Dr. Brown was _______________ of Foreign Affairs from 1991 till 1996.
(A) a Minister
(B) Minister
(C) the Minister
(D) Ministerial
context size : 3
query : "Brown was a Minister of" : 검색결과 : 7건
query : "Brown was Minister of" : 검색결과 : 9건
query : "Brown was the Minister of" : 검색결과 : 4건
query : "Brown was Ministerial of" : 검색결과 : 0건
정답 : (B)
(A) a Minister
(B) Minister
(C) the Minister
(D) Ministerial
context size : 3
query : "Brown was a Minister of" : 검색결과 : 7건
query : "Brown was Minister of" : 검색결과 : 9건
query : "Brown was the Minister of" : 검색결과 : 4건
query : "Brown was Ministerial of" : 검색결과 : 0건
정답 : (B)
정답인 (B) 이외에도 (A), (C) 등의 틀린 표현도 실제 웹 문서에서는 많이 쓰이고 있습니다. 정답을 못맞춘 경우는 프로그램이 제 역할을 못한 셈 치고 빼버리고, 정답을 맞춘 문제에서만 봐도 검색 결과의 약 21%는 틀린 보기의 표현이 웹문서에서 실제로 출현하고 있었습니다. 월드와이드웹의 토익점수는 79점이라고 봐야 겠군요.