문자열 재배열 등으로 이메일 주소 감춰… 자연어 처리의 필터링 기법은 오류 많아
마케팅 연구자들에 따르면 스팸메일의 광고효과는 1%에도 미치지 못한다고 한다. 90% 안팎의 사람들은 광고성 메일을 읽어보지도 않고 삭제한다. 그런데 이런 사실로 스팸메일 발송대행사들을 “쓸데없는 일에 투자하지 말도록” 설득하는 것은 별 의미가 없다. 얼마 전에 등장한 사이버 구걸행위에서 스팸메일의 효과를 미루어 짐작할 수 있다. 3개월된 미숙아의 치료를 위해 돈이 필요하니 온라인으로 보내달라는 것이었다. 메일 한통 보내고 500여명에게서 800만원과 헌혈증 143개를 받았다고 한다. 스팸광고의 효과를 %로 따지는 게 무의미한 까닭이 여기에 있다. 광고성 메일은 전체 발송건수가 일반적인 우편광고보다 비교가 안 될 정도로 많다. 100만건 단위로 보낸 스팸메일에서 0.5%에게만 광고가 먹혀더라도 무려 5000명에게 뭔가를 팔 수 있는 것이다. 스팸메일이 증가하는 것은 어쨌거나 장사가 되기 때문이다.
1%의 광고효과에 매달리는 까닭
그렇다면 네티즌들이 스팸메일에 적극적으로 대처하는 방법은 없는 것일까. 이론적으로는 간단하다. 자신을 감추거나 날아온 메일을 적절히 걸러내면 된다. 보통 스팸메일용 주소는 인터넷의 홈페이지를 돌아다니며 메일주소만을 수거해오는 프로그램을 통해 얻는다. 따라서 홈페이지나 게시판 등에 자신의 주소를 공개하는 것에는 상당한 각오를 해야 한다. 그런데 이런 프로그램이 주소를 인식해서 가져오는 방법은 바로 ‘골뱅이’라고 하는@기호를 찾아서 가져온다. 즉@기호 주위에 있는 연결된 문자열을 적절히 파악하여 이를 수거한다는 것이다. 이를 이용해 대책을 세울 수 있다. 자신의 전자우편 주소가sample@test.good.co.kr이라면, 이것을 sample@ test . good . co . kr처럼 단어 중간을 띠어 공백문자를 넣는 것이다. 이렇게 하면 일반 사용자는 주소를 읽는 데 어려움이 없다. 하지만 기계적인 프로그램은@ 주위에 다른 인접한 문자열이 없으므로 제대로 된 주소를 가져가지 못한다. 아예 자신의 이메일 주소를 포토샵으로 처리하는 방법도 있다. 문자가 아닌 이미지로 만들어 이메일 주소를 수집하는 프로그램의 접근을 원천봉쇄하는 것이다. 물론 필요한 사람은 일일이 주소를 다시 조합해 적어야 하는 수고를 해야 한다.
이미 자신의 주소가 스팸업자들의 손에 넘어갔다면 속수무책이다. 주소를 모두 바꾸고 처음부터 제대로 시작하는 게 상책이다. 하지만 이미 알려진 자신의 주소를 바꾸는 일은 현실적으로 매우 힘들다. 최근 국내업체에서도 스팸주소 수거용 프로그램이 서버에 침투하지 못하도록 막아주는 프로그램이 개발, 판매되고 있다. 그렇다고 한 서버에서 메일 주소를 막더라도 틈새는 수두룩하다. 한 사람의 주소는 그 기관뿐만 아니라 그 사람과 관계된 많은 기관에 노출되어 있는 탓이다. 만일 단체 전자주소(mail alias) 같은 데 포함됐다면 서버에서 자신의 메일을 노출시키지 않아도 다른 곳을 우회해서 얼마든지 주소를 가져갈 수 있다. 일반인들이 가장 쉽게 사용하는 스팸방지법은 필터링을 이용하는 방법이다. 메일의 내용에서 특정한 단어나 문맥을 파악하여 이를 스팸으로 분류하는 것이다. 이 방법은 스팸메일의 교묘함과 끊임없는 전쟁을 해야 한다. 예컨대 뜬금없이 날아온 “입금하신 30만원에 따르는 제품주문은 잘 처리되고 있습니다. 아래 부분을 클릭하셔서 주문내용을 확인하시기 바랍니다”와 같은 메일을 보고 그냥 지나치기 힘들 것이다. 물론 주문을 확인하려고 하면 동시에 화면은 성인용 광고사이트로 날아가게 마련이다. 컴퓨터과학에서 주어진 문맥을 프로그램이 읽어 그 내용을 파악하는 것을 일컬어 ‘자연어 처리’(Natural Language Processing)라고 한다. 사람이 판단하기에도 광고메일인지를 파악하기 힘든 상황에서 기계가 알아서 파악하여 버릴 것은 버리도록 하는 건 다소 위험이 따른다. 일단 스팸메일을 정의하는 것부터 난관에 부닥친다. 난데없이 연락하지도 않았는데 자동차 세척기를 사라는 것은 광고메일이지만, 동창회 사무국을 통해서 날아오는 할인관광쿠폰이 불특정인에게 뿌려지는 광고인지 아니면 동호인들 간 사적인 연락인지 분간하기란 쉽지 않다. 따라서 필터링 기술이 아무리 발달해도, 스팸광고업자들은 얼마든지 이를 피할 수 있다. 도리어 필터링 기술을 과신하는 것은 광고가 아닌 메일을 지울 가능성을 내포하고 있다. 결국은 자신의 노력을 들여서 살펴보아야 한다. 최후로 남는 방책은 법에 호소하는 것이다. 미국에서는 이미 스팸메일 방지법과 관련하여 한창 논쟁 중에 있다. 인터넷 광고대행사의 엄청난 로비와 시민단체들의 압력에 구체적인 내용은 드러나지 않은 상황이다. 그래도 올해 가을쯤이면 우리나라에서도 일정한 법률이 가시화할 것으로 알려졌다. 핵심은 옵트인(Opt-in)과 옵트아웃(Opt-out)의 차이에 관한 논쟁이다. 쉽게 말해 옵트인은 수신자가 보내라고 허락할 때만 광고사가 보낼 수 있는 것이다. 이에 반해 옵트아웃은 명시적으로 보내지 말라고 하지 않으면 계속 보낼 수 있는 제도다. 한때 미국에서는 광고용 메일을 거부하는 사람들의 리스트를 만들어 모든 광고회사가 이 리스트를 참조하여 여기에 들어 있는 사람에게는 보내지 않도록 하는 제도를 고안했다. 하지만 이런 제도를 지키는 업자는 별로 없었다. 도리어 그렇게 작성된 리스트가 가장 ‘싱싱한’ 고객의 정보로 악용되었다. 메일이 거쳐 지나온 컴퓨터의 인터넷주소(IP)까지 바꾸는 프로그램을 쓴 스팸은 추적조차 불가능하게 하고 있다. 우리나라에서도 약 70∼80% 정도의 스팸은 추적이 불가능한 메일이다. 최근 우리나라에서 몇몇 업체에게 불법적인 스팸광고에 따른 과태료 400만원을 부과했지만 이런 일은 스팸전문업자에게 조금도 위협이 되지 못하고 있다. 한편 보수적인 미 공화당을 중심으로 스팸메일용 소프트웨어를 유포하거나 이를 제작하는 사람을 처벌하려 하고 있다. 이것은 모든 프로그램은 착한 프로그램과 나쁜 프로그램으로 나눌 수 있다는 엄청난 발상이다. 이 역시 이론적으로나 현실적으로 불가능해 적절한 방법은 아니다. 제도보다 빨리 진화하는 스팸메일 스팸메일의 또 다른 문제는 성인용 사이트처럼 메일이 국경을 넘나드는 것이다. 예를 들면 미국에 뿌려지는 스팸의 약 60%는 외국에서 들어오는 것이라는 보고가 있다. 가장 많은 스팸을 보내는 서버의 소유국으로 제1위는 러시아, 다음으로는 프랑스, 그리스, 네덜란드가 있다. 그리고 SpamCop사의 조사에 의하면 스팸메일에 대한 상대국의 항의에 가장 무성의한 태도로 대처하는 나라는 1위가 중국, 다음이 한국, 태국, 일본 순이라고 한다. 최근에는 미국의 인터넷 도메인 관리업체로부터 우리나라의 wo.to 도메인이 상습 스팸 발송도메인으로 찍히는 사건도 있었다. 당시 이 도메인에 걸린 수십만개의 국내사이트에서 미국으로의 접속이 금지되는 수모를 당하기도 했다. 이전에도 학내의 허술한 서버관리를 비집고 들어간 일이 있었다. 스팸의 중간경유지로 대학서버를 사용해 대학의 특정 서버가 중단된 것이었다. 인터넷 광고업자들의 처지를 아무리 이해하려 해도 다른 사람들의 불편함에 기대어 돈벌이를 하는 것은 결코 바람직하지 않다. 심지어 초등학생들 앞으로도 성인물 광고를 무차별적으로 뿌려대니 말이다. 이를 막기 위해서는 일정한 메일발송 사용료를 받는 것말고는 어떤 대안도 없어 보인다. 이제 머지않아 휴대폰에도 스팸광고가 날아들 조짐을 보인다. 위치정보를 추적해 마케팅에 이용할 수도 있다. 누군가 대형백화점 주변을 지나면 구매성향을 파악해 “지금 빨리 들어와서 구입하면 50%까지 할인해준다”는 식의 전화를 쉴새없이 걸어대는 것이다. 조환규/ 부산대 교수·컴퓨터과학

컴퓨터그래픽/ 차승미
이미 자신의 주소가 스팸업자들의 손에 넘어갔다면 속수무책이다. 주소를 모두 바꾸고 처음부터 제대로 시작하는 게 상책이다. 하지만 이미 알려진 자신의 주소를 바꾸는 일은 현실적으로 매우 힘들다. 최근 국내업체에서도 스팸주소 수거용 프로그램이 서버에 침투하지 못하도록 막아주는 프로그램이 개발, 판매되고 있다. 그렇다고 한 서버에서 메일 주소를 막더라도 틈새는 수두룩하다. 한 사람의 주소는 그 기관뿐만 아니라 그 사람과 관계된 많은 기관에 노출되어 있는 탓이다. 만일 단체 전자주소(mail alias) 같은 데 포함됐다면 서버에서 자신의 메일을 노출시키지 않아도 다른 곳을 우회해서 얼마든지 주소를 가져갈 수 있다. 일반인들이 가장 쉽게 사용하는 스팸방지법은 필터링을 이용하는 방법이다. 메일의 내용에서 특정한 단어나 문맥을 파악하여 이를 스팸으로 분류하는 것이다. 이 방법은 스팸메일의 교묘함과 끊임없는 전쟁을 해야 한다. 예컨대 뜬금없이 날아온 “입금하신 30만원에 따르는 제품주문은 잘 처리되고 있습니다. 아래 부분을 클릭하셔서 주문내용을 확인하시기 바랍니다”와 같은 메일을 보고 그냥 지나치기 힘들 것이다. 물론 주문을 확인하려고 하면 동시에 화면은 성인용 광고사이트로 날아가게 마련이다. 컴퓨터과학에서 주어진 문맥을 프로그램이 읽어 그 내용을 파악하는 것을 일컬어 ‘자연어 처리’(Natural Language Processing)라고 한다. 사람이 판단하기에도 광고메일인지를 파악하기 힘든 상황에서 기계가 알아서 파악하여 버릴 것은 버리도록 하는 건 다소 위험이 따른다. 일단 스팸메일을 정의하는 것부터 난관에 부닥친다. 난데없이 연락하지도 않았는데 자동차 세척기를 사라는 것은 광고메일이지만, 동창회 사무국을 통해서 날아오는 할인관광쿠폰이 불특정인에게 뿌려지는 광고인지 아니면 동호인들 간 사적인 연락인지 분간하기란 쉽지 않다. 따라서 필터링 기술이 아무리 발달해도, 스팸광고업자들은 얼마든지 이를 피할 수 있다. 도리어 필터링 기술을 과신하는 것은 광고가 아닌 메일을 지울 가능성을 내포하고 있다. 결국은 자신의 노력을 들여서 살펴보아야 한다. 최후로 남는 방책은 법에 호소하는 것이다. 미국에서는 이미 스팸메일 방지법과 관련하여 한창 논쟁 중에 있다. 인터넷 광고대행사의 엄청난 로비와 시민단체들의 압력에 구체적인 내용은 드러나지 않은 상황이다. 그래도 올해 가을쯤이면 우리나라에서도 일정한 법률이 가시화할 것으로 알려졌다. 핵심은 옵트인(Opt-in)과 옵트아웃(Opt-out)의 차이에 관한 논쟁이다. 쉽게 말해 옵트인은 수신자가 보내라고 허락할 때만 광고사가 보낼 수 있는 것이다. 이에 반해 옵트아웃은 명시적으로 보내지 말라고 하지 않으면 계속 보낼 수 있는 제도다. 한때 미국에서는 광고용 메일을 거부하는 사람들의 리스트를 만들어 모든 광고회사가 이 리스트를 참조하여 여기에 들어 있는 사람에게는 보내지 않도록 하는 제도를 고안했다. 하지만 이런 제도를 지키는 업자는 별로 없었다. 도리어 그렇게 작성된 리스트가 가장 ‘싱싱한’ 고객의 정보로 악용되었다. 메일이 거쳐 지나온 컴퓨터의 인터넷주소(IP)까지 바꾸는 프로그램을 쓴 스팸은 추적조차 불가능하게 하고 있다. 우리나라에서도 약 70∼80% 정도의 스팸은 추적이 불가능한 메일이다. 최근 우리나라에서 몇몇 업체에게 불법적인 스팸광고에 따른 과태료 400만원을 부과했지만 이런 일은 스팸전문업자에게 조금도 위협이 되지 못하고 있다. 한편 보수적인 미 공화당을 중심으로 스팸메일용 소프트웨어를 유포하거나 이를 제작하는 사람을 처벌하려 하고 있다. 이것은 모든 프로그램은 착한 프로그램과 나쁜 프로그램으로 나눌 수 있다는 엄청난 발상이다. 이 역시 이론적으로나 현실적으로 불가능해 적절한 방법은 아니다. 제도보다 빨리 진화하는 스팸메일 스팸메일의 또 다른 문제는 성인용 사이트처럼 메일이 국경을 넘나드는 것이다. 예를 들면 미국에 뿌려지는 스팸의 약 60%는 외국에서 들어오는 것이라는 보고가 있다. 가장 많은 스팸을 보내는 서버의 소유국으로 제1위는 러시아, 다음으로는 프랑스, 그리스, 네덜란드가 있다. 그리고 SpamCop사의 조사에 의하면 스팸메일에 대한 상대국의 항의에 가장 무성의한 태도로 대처하는 나라는 1위가 중국, 다음이 한국, 태국, 일본 순이라고 한다. 최근에는 미국의 인터넷 도메인 관리업체로부터 우리나라의 wo.to 도메인이 상습 스팸 발송도메인으로 찍히는 사건도 있었다. 당시 이 도메인에 걸린 수십만개의 국내사이트에서 미국으로의 접속이 금지되는 수모를 당하기도 했다. 이전에도 학내의 허술한 서버관리를 비집고 들어간 일이 있었다. 스팸의 중간경유지로 대학서버를 사용해 대학의 특정 서버가 중단된 것이었다. 인터넷 광고업자들의 처지를 아무리 이해하려 해도 다른 사람들의 불편함에 기대어 돈벌이를 하는 것은 결코 바람직하지 않다. 심지어 초등학생들 앞으로도 성인물 광고를 무차별적으로 뿌려대니 말이다. 이를 막기 위해서는 일정한 메일발송 사용료를 받는 것말고는 어떤 대안도 없어 보인다. 이제 머지않아 휴대폰에도 스팸광고가 날아들 조짐을 보인다. 위치정보를 추적해 마케팅에 이용할 수도 있다. 누군가 대형백화점 주변을 지나면 구매성향을 파악해 “지금 빨리 들어와서 구입하면 50%까지 할인해준다”는 식의 전화를 쉴새없이 걸어대는 것이다. 조환규/ 부산대 교수·컴퓨터과학









