[%%IMAGE1%%][%%IMAGE2%%]‘피-값’(p-value)이 있다. 혹시 통계 수업을 수강한 적이 있다면 어렴풋이 기억이 날지도 모른다. 과학자라면 누구나 알고 있는 용어다. 우리 말로는 유의확률이라고 한다. 들어본 적이 있지만 잘 모르겠다고 해도 크게 신경 쓸 필요는 없을 것 같다. 전문가들조차도 피-값이 정확히 무엇인지 쉽게 설명하기 쉽지 않은 모양이다. 미국 데이터 분석 전문 매체 &lt;파이브서티에이트&gt;(538)의 과학 담당 기자, 크리스티 애쉬원든(​Christie Aschwanden)이 스탠퍼드 대학교의 메타 사이언스(과학 방법론) 포럼에 모인 전문가들에게 같은 질문을 던졌지만<a href="https://fivethirtyeight.com/features/not-even-scientists-can-easily-explain-p-values/" target="_blank"> 쉽게 답할 수 있는 학자는 많지 않았다니</a> 말이다. 그가 얻은 그나마 가장 단순한 답은 이런 것이다. 당신이 어떤 도박사와 동전 던지기 내기를 한다고 하자. 앞면이 나오면 도박사, 뒷면이 나오면 당신이 이긴다. 그런데 당신은 도박사가 동전의 앞면이 잘 나오도록 조작했다고 의심스럽다. 그래서 동전을 100번 던지는 실험으로 검증해 보기로 한다고 하자. 이 실험에서 피-값이란 “만약 동전에 조작이 없다면 나왔을 앞면의 횟수만큼의 횟수가 이 동전을 던져서 나올 ‘확률’”을 뜻한다. 달리 말하면 피-값이 낮으면 낮을수록 동전 앞면이 정상적인 동전처럼 나오는 확률이 낮다는 뜻이다. 애쉬원든 기자는 이 설명도 “여러 통계학자가 피-값을 너무 단순화했다고 비판할 것”이라 덧붙였으니, 제대로 설명하기 쉽지 않은 개념임은 분명해 보인다. 피-값은 수많은 과학 논문에서 연구자가 밝히고자 했던 가설을 검증하는 중요 근거로 쓰이곤 한다. ‘접시의 색에 따라 섭취하는 음식량이 달라진다’거나 ‘적당히 마시는 포도주는 심장병 예방에 좋다’같은 연구결과들이 해당 실험의 피-값을 근거로 산출되곤 한다.[%%IMAGE3%%] 과학에서 쓰이는 피-값의 개념에 대해 좀 더 보자. 앞서 동전 사례의 경우 증명하고자 했던 가설은 ‘이 동전은 앞면이 많이 나오도록 조작돼 있다’는 것이었다. 그런데 피-값은 ‘정상적인 동전처럼 앞면이 나오느냐’에 대한 확률인 것이 의아해 보일 수도 있을 것이다. 과학 방법론에서 피-값 검증은 이렇게 보통 틀렸음을 증명하고자 하는 가설을 세우는 방식으로 이뤄진다. 즉, ‘정상적인 동전처럼 앞면이 나올 것이다’라는 가설이 틀렸음을 피-값이 너무 작다는 근거로 드러내서 자신의 주장을 증명하는 것이다. 이렇게 무위로 돌리고자 세우는 가설을 ‘귀무가설’이라 한다. 피-값이 낮으면 낮을수록 귀무가설이 틀렸을 확률은 올라가는 셈이다. 피-값이 충분히 낮을 때, 과학자들은 다른 말로 “통계적으로 유의하다”고 하곤 한다. ‘접시의 색깔이 어떻건 섭취 음식량은 같다’거나 ‘적당량 포도주를 마시건 마시지 않건 심장병에 걸릴 확률이 똑같다’는 귀무가설의 피-값이 충분히 낮으니, 그 반대가 ‘통계적으로 유의하게’ 성립한다는 것이다. 그리고 그런 취지의 논문을 내는 것이다. 문제는 실험과 데이터를 다루는 능력이 높아지면서 원하는 피-값을 기술적으로 ‘얻어내는’ 일이 점차 늘고 있다는 것이다. 이를 ‘피-해킹’(p-hacking)이라고 한다. 피-해킹은 결코 데이터를 조작하는 것이 아니다. 실험의 결괏값에는 손을 대지 않지만, 이를 해석하는 귀무가설을 여러 방법으로 바꿔보고 분석할 데이터를 선별해서 원하는 피-값을 얻어내는 것이다. 이 문제가 과학계에 얼마나 심각한 일인지, 미국통계학회(ASA)는 <a href="https://tandfonline.com/toc/utas20/73/sup1?nav=tocList&amp;" target="_blank">지난 3월 낸 학회지를 통틀어 이 피-해킹 관련 내용</a>으로 채웠다. 피-해킹이 최근에 드러난 새로운 문제는 아니다. 이미 2015년부터 과학계에서는 과학 윤리의 중요한 문제로서 심각성이 드러난 바 있다. 하지만 좀체 근절되지 않고 있는 것이다. 누구나 교묘하게 원하는 결론을 낼 수 있다면, 과학 논문과 주장문의 차이는 대체 무엇이란 말인가? 이 때문에 ‘기초·응용 사회심리학’이라는 학술지는 2015년 제출 논문에 피-값을 근거로 제시하는 것을 아예 금지해 버렸다. 2016년 미국통계학회는 이례적으로 피-값을 잘못 적용하는 경우에 대한 <a href="https://amstat.tandfonline.com/doi/abs/10.1080/00031305.2016.1154108#.XKcGKpj7RPb" target="_blank">명확한 가이드라인</a>을 제시했다. 2017년에는 저명한 통계학자 72명이 모여서 “통계적으로 유의하다”는 기준을 훨씬 낮출 것을 <a href="https://www.nature.com/news/big-names-in-statistics-want-to-shake-up-much-maligned-p-value-1.22375" target="_blank">제안했다</a>. 기존에는 피-값이 0.05 보다 낮으면 통상 유의하다고 여겼는데, 이를 0.005 아래로 낮추자는 제안이다. 미국통계학회의 이번 제안은 기존 접근과 달랐다. 학회는 과학계가 ‘통계적 유의성’에 대한 집착에서 벗어나야 한다고 주장했다. 어떤 연구가 ‘유의하기’ 위해서 피-값에 의존해야 한다는 생각을 버리자는 것이다. 학회는 앞으로 피-값이란 어떤 실험의 결과가 실제 그러한지 여부와 별개로 그저 통곗값 가운데 하나로만 쓰여야 할 뿐, 무언가를 결정짓는 수치로 쓰여선 안된다고 권고했다. 미국통계학회 회장 로널드 와서스테인(Ronald Wasserstein)은 <a href="https://undark.org/article/statisticians-p-hacking/" target="_blank">“통계적 유의성이란 족쇄에서 벗어나는 것이 과학은 과학이 되고, 통계는 통계가 되는 길”</a>이라고 말했다. 그는 또 이런 관점이 정착되면 초반에는 혼란이 있겠지만 장기적으로는 “(연구 결과가 갖는) 불확실성의 한계를 받아들이고… 더 나은 측정법, 더 정교한 연구 설계, 더 많은 표본을 얻고자 노력하는” 계기가 되리라고 과학 전문지 <a href="https://undark.org/article/statisticians-p-hacking/" target="_blank">&lt;언다크&gt;(Undark)와 인터뷰</a>에서 말했다. 피-해킹에 대한 과학계의 논의가 앞으로 어떻게 전개될지는 미지수다. 분명한 것은 과학이 사실과 거짓의 아슬아슬한 경계에 있듯, 데이터 역시 그렇다는 것이다. 피-값은 몰라도 이 점은 기억해 둘 만하다.권오성 기자 sage5th@hani.co.kr

[사설] 사직·휴진 앞장선 서울대병원, 공공성 책무는 잊었나

생존 해병 “임성근, 가슴장화 신고 물에 들어가라 지시했다”

국정농단 특검, 시즌2 [뉴스룸에서]

채상병 기록 이첩 직후, 대통령실 ‘등장’…국수본·해병·국방부에 전화

해병 수사외압 의혹

좀비보다 더 무서운 기후위기…SF드라마로 만드니 현실감 있네

아기도 청소년도 255명 기후소송…“온실가스 목표치 불충분”

51개국 2340건 ‘기후소송’…“탄소정책 불충분 위헌” “인권 침해” 판단 잇따라

기후 위기

수련의들은 왜 돌아오지 않는가

나는 시골 ‘보따리상 의사’…평범한 의사가 여기까지 오려면

총장-의대교수 이견 큰데…교육부 “이달 안 정원 확정하라”

의대 정원 확대

지금은 물가안정이 최우선이다 [세상읽기]

“이란-이스라엘 전면전 땐 물가 5% 육박할 수도”

집값 빼고도 6298만원…‘웨딩플레이션’ 허리 휘는 예비부부

치솟는 물가

조국혁신당 원내대표에 황운하…10분 만에 만장일치로

‘도로 친윤’ 국힘…이철규 원내대표 밀며 “욕먹어도 단일대오”

윤석열 대통령은 9수를 했다 [권태호 칼럼]

22대 총선 이후

나세르 병원 암매장 주검 310구로 늘어…이, 가자 폭격 재개

컬럼비아대생이 학교에 천막 친 이유 “이스라엘에 투자 멈춰야”

중동 확전 기로

조국 “윤 대통령, 음주 자제하고 김건희 인맥 정리를”…10개 제안

‘이재명 엮으려고’…검찰, 이화영 ‘술판 회유’ 논란 일파만파

검사실서 사기범 통화 6번 방치…징계받은 ‘이화영 수사’ 지휘자

검찰 개혁

진성준 “윤, ‘망나니 칼춤’ 류희림 해촉하고 언론탄압 사과해야”

고민정·이준석·황운하 한목소리 “언론장악 세력 심판”

선방위는 윤 대통령처럼…그들의 길은 역사가 된다

윤 정부 언론장악

방심위, ‘김건희 주가조작’ 의혹 다룬 MBC 라디오도 징계

조국 “윤 대통령, 내가 제안한 만남도 수용하길”

윤 대통령 장모 가석방 되나…법무부, 23일 심사

김건희 리스크

바이든은 ‘틱톡 강제 매각 법’ 서명했는데…선거캠프 계속 사용

발 빠른 일본…아소 부총재, 트럼프 만나 1시간 대화

‘성관계 입막음’ 트럼프 재판, 배심원 12명은 어느 쪽 손 들까

미국 대선

이재명 “채상병 특검 수용” 공개 압박…‘윤-이 회담’ 최대 화두 됐다

“올해 스팸신고 건수 100만건 증가, 대출·코인·주식 권유 성행”

아동성범죄 가해자 33.7%는 ‘인터넷 채팅’으로 알게 된 사람

쿠팡, 하도급 업체에 실적 부진 PB상품 할인 비용 떠넘겼나

대법 “일용직 노동자 월 근로일수 산정…20일 초과 안 돼”

‘테무·알리’ 판매 어린이제품 22개 중 11개 부적합

5평 토굴의 스님 “편하다, 불편 오래되니 ‘불’ 자가 떨어져 버렸다”

도시에서 떠밀려온 의사, 우리도 원하지 않아요

민희진, 1년 전 “어도어는 내 음악·사업 위한 회사” 인터뷰 재조명

권오성

science

science_general

[권오성의 세상을 바꾼 데이터] 과학 연구의 유의성 가늠하는 널리쓰이는 통계값, p-value 조작 없이 p-value 조작하는 p-hacking에 잇따르는 경고 데이터 분석 새 길 모색할 때

technology

비트코인의 미래 가격을 알고 싶다면? 아보카도에 답이 있다

돌에도 의식이…갈릴레오식 과학 패러다임의 전환

인간의 의식을 데이터로 전환할 수 있을까 ①

권오성의 세상을 바꾼 데이터

이것은 과학인가 조작인가, 피-해킹(p-hacking)

해병 녹취엔 “사단장께 건의했는데”…임성근 수색중단 묵살 정황

‘자두밭 청년’ 향년 29…귀농 7년은 왜 죽음으로 끝났나

하이브, 민희진 오늘 고발…“‘뉴진스 계약 해지’ ‘빈껍데기 만들자’ 모의”

온몸 굳어가지만…셀린 디옹 “아무것도 날 막을 수 없다”

한강에서 열리는 ‘수면 콘서트’…침대에 누워 잠들면 됩니다

전체

“식물대통령 절감할 것…윤 대통령, 임기 1년 단축해야” [막전막후]

윤 대통령 “남은 임기 3년 도와달라”…낙선 의원들 격려 오찬

대통령실 비서관 ‘해병 수사기록 회수 개입’ 정황…민주 “특검뿐”

김부겸·박용진·임종석이 왔다가면 험지 분위기가 달라졌다

‘비례 당선’ 서미화·김윤 합류한 민주당…171석 확보

정치

의대교수 집단휴진에 암환자들 “죽음 선고하나” 절규

[단독] ‘한 켤레 2200원’ 제화공은 소사장 아닌 노동자…퇴직금 소송 승소

후쿠시마 농어·가자미…오염수 방류 뒤 ‘세슘137’ 껑충 뛰었다

거짓진술 국방부 법무관리관, ‘대통령실 개입’ 덮으려 했나

일제가 속은 ‘계산된 자백’…27살 비밀결사 리더의 진술 투쟁

사회

전국 대중교통 환급 ‘K-패스’ 발급 시작…혜택 따져보세요

고물가가 바꾼 어버이날 선물 순위…신선식품, 여행 제쳤다

‘1인 가구 10평 원룸’ 살아라?…임대주택 면적 논란에 물러선 국토부

인수가 1조 ‘아시아나 화물’…후보 4곳 중 3곳은 자본잠식

공정위, ‘리니지 슈퍼계정 의혹’ 엔씨소프트 현장조사

65개 기업·11개 레이블 거느린 하이브…5조원대 플랫폼 경영 시험대

‘뉴진스’ 제작자 민희진, 방시혁에 반기?…하이브 주가 8% 폭락

쿠팡이츠 ‘상생 모드’ 끝…전통시장 상인도 수수료 4.9% 내야

카카오그룹, ESG 경영 강화…대통령이 질타한 ‘카카오택시’ 상생 모색

멤버십 58% 올린 쿠팡, 해지 방어에 쩔쩔

경제

‘범죄도시4’ 개봉 첫날 관객 82만…역대 오프닝 기록 4위

방시혁에 맞선 ‘민희진의 난’ 돌이킬 수 없다…뉴진스 앞날은?

동물이 사라진 세상, 인간이 고기가 돼 식탁에 [책&생각]

[인터뷰] 민희진 “K팝 산업 고질적 문제 개선하려 시도한 것은…”

이렇게 관능적인 스포츠 영화라니, ‘챌린저스’

세계 최대 티라노 ‘스코티’ 한국 왔다…“저 이빨 봐” [포토]

‘범죄도시4’ 마동석 주먹도 악당도 더 세졌는데…

문화

뒤집혀 착륙한 일본 달 탐사선, ‘영하 170도 밤’ 세번째 살아남았다

하루 2만번 눈 깜빡임…더 잘 소통하고 잘 보게 된다

햇빛을 바람 삼아…우주돛배 발사

동물실험, 피할 수 없으면 대체하라

“동물실험 대체하는 컴퓨터, 화학독성 예측 정확도 더 높아”

‘24시간 풀가동’…우주태양광발전, 지구 전송 실험 첫 성공

뒤집혀 착륙해도 괜찮아…길고 추운 ‘달의 밤’ 두 번 버텼으니깐

“우리 서로 사랑하게 해 주세요” 공생 이야기

단두대의 이슬로 사라진 화학자, 라부아지에

미래과학

권력에 타협하지 않는 언론, 한겨레 후원회원이 되어주세요