본문 바로가기

분류 전체보기125

Liner Regression and How to minimize cost Lec [Simplified hypothesis and Cost] b를 생략하여 Hypothesis를 간략화 시킨다. [What cost(W) looks like?] W의 값에 따라 변화하는 cost의 값을 살펴보기 -> W의 값이 1일 때, cost가 0으로 최소화된 모습을 보인다. [Gradient descent algorithm] 경사를 따라 내려가면서 최저점을 찾기 위해 경사 하강 알고리즘을 사용한다. -> 변수의 개수와 상관없이 사용할 수 있는 알고리즘 [How it works? (Gradient descent algorithm의 동작 방식)] 최초의 W, b 값을 정해 최소점에 도달할 때까지 cost가 줄어들 수 있는 방향으로 W, b 값을 지속적으로 업데이트 한다. [Formal defini.. 2023. 7. 30.
Simple Liner Regression Lec [Regression] Regression toward the mean: 전체 평균으로 되돌아간다. -> 크거나 작은 데이터가 나와도 결과적으로 전체 평균으로 되돌아가려는 속성을 가진다는 통계적 원리를 의미한다. [Linear Regression] y = ax + b -> 데이터를 가장 잘 대변하는 직선의 방정식을 찾는 것 (기울기와 y 절편을 구함) [Hypothesis] y = ax + b 대신 H(x) = Wx + b로 직선의 방정식을 나타낸다. [Which hypothesis is better?] 이를 결정하기 위해서는 cost를 생각해야 하는데 이때, Hypothesis를 기반으로 cost를 구한다. [Cost, Cost function] H(x) – y -> 가설과 실제 데이터의 차이 .. 2023. 7. 30.
R로 데이터 과학 맛보기 [R의 기본 기능] R에 기본적으로 mtcars 데이터 셋이 mtcars라는 이름으로 설치되어 있기 때문에 mtcars라는 명령어를 실행하면 데이터를 볼 수 있다. summary 함수를 사용하면 각 속성별로 값 분포를 볼 수 있다. 데이터를 파일로 저장하거나 불러들이는 데는 write.table()과 read.table() 함수를 사용한다. 다음은 mtcars 데이터를 파일로 저장하고 이를 cars라는 이름으로 다시 불러들이는 방법이다. 여기서 header=T 옵션은 데이터 파일의 첫 줄을 속성 목록으로 사용한다는 의미다. 앞으로는 원본 데이터인 mtcars 대신에 cars를 사용하여 실습을 진행한다. R의 기본 자료형은 테이블 형태의 데이터 프레임이기에 대부분의 데이터는 한 화면에 들어오지 않는다. 그.. 2023. 7. 30.
엑셀로 데이터 과학 맛보기 [데이터 불러오기] mtcars 데이터를 담은 mtcars.txt 파일을 텍스트 마법사로 불러들이는 과정은 다음과 같다. 1. mtcars.txt 파일을 메모장으로 연다. 2. 내용을 모두 복사하여 엑셀에 붙여넣는다. 3. Ctrl을 눌러 텍스트 마법사로 들어간다. 4. 텍스트 마법사가 열리면 모든 설정을 그대로 둔 채 마침을 누른다. 5. 다음과 같이 엑셀에 테이블 형태로 데이터가 정리된다. [데이터 준비하기] 데이터를 불러온 후에는 분석에 맞는 형태로 가공해야 한다. 가공 작업에는 필요한 데이터를 선택하고, 오류를 검사하며, 필요한 경우 적절히 정렬하거나 집계하는 작업이 포함된다. 엑셀에서 데이터를 가공하는 가장 손쉬운 방법은 '표 서식' 기능을 사용하여 데이터를 테이블 형태로 만드는 것이다. 테이블.. 2023. 7. 30.
[백준 10926번] ??! (python) [문제] [풀이] print(input() + "??!") 이때, print(input() + "??!")로 출력하게 되면 input 한 값과 "??!"이 공백없이 출력된다. 만약 input()한 값이 준하라면 "준하??!" 형태로 출력된다. 반대로 print(input(), "??!")로 출력하게 되면 input 한 값과 "??!" 사이에 공백이 포함되어 출력된다. 만약 input()한 값이 준하라면 "준하 ??!" 형태로 출력된다. 문제에서는 공백없이 출력되는 것을 요구했기 때문에 print(input() + "??!")로 출력을 진행해주었다. 2023. 7. 30.
[백준 10869번] 사칙연산 (python) [문제] [풀이] A, B = map(int, input().split()) print(A+B) print(A-B) print(A*B) print(int(A/B)) print(A%B) map(int, input().split())를 사용하여 입력받은 값을 공백을 기준으로 분리하여 변수 A, B에 차례대로 저장한다. A/B에서 정수 둘을 나누고 떨어지지 않을 때 자동으로 float형으로 출력된다. 따라서 int형으로 변환 후에 출력해야 한다. 2023. 7. 30.