Data.Math.Phys2017. 12. 6. 01:00



Linear Regression ( 선형회귀 )


정의 : (x,y) 로 구성된 데이터의 분포 를 직선(=Linear) 표현하는것.


직선이라 함은 함수식 y = ax +b. where a=기울기, b=절편.


주어진 (x,y) 데이터 셋을 가장 잘 대표하는 직선 결정하는 방법. : 데이터와 직선사이의 차이값들이 최소화 되는 a 와 b를 구한다.   


차이값의 정의는 여러 방식이 가능하며, 흔하게 사용되는 식은 아래처럼 정의된다. 






주. 

표현하는 용어에 "회귀" 라는 단어가 들어갔다고 데이터들을 만들어낸 운동방정식이 그 직선으로 꼭 복귀(회귀 )하고자 하는 성질이 있다는 의미 아님.  자연과학, 공학적 대상에서 용어에 사용된 단어의 인문학적 언어적 의미로 엉뚱한 해석하는 바보같은 짓 하지말 것.  이치를 파악하는데 가장 방해된다. 


Linear Regression 이란  산포된 데이터를 직선으로 단순화 시킨다면 이라는 "가정"을 하고, 가장 단순하게 대상의 경향 파악 수단으로 사용된다. 그런데 세상은 의외로 단순해서 구질구질한것 제거하고 단순히 직선으로 봐도 되는 경우가 많다, 특히 사람의 행위가 관련된 현상들. 혹은 단순하게 보고 싶다. 어차피 복잡한건 이해도 못하니... 



///1537.


Posted by 리치굿맨

댓글을 달아 주세요