전체 글95 딥러닝의 기본 개념 [Ultimate dream: thinking machine] 인간의 뇌는 굉장히 복잡한 반면에 뉴런이라고 불리는 유닛은 굉장히 단순하게 동작이 된다. 어떤 input이 들어오면 그 input에 weight를 곱한 만큼 신호가 들어온다. 신호의 값들이 합쳐지고 통과하면서 bios가 더해지는데 이 최종 값이 특정 값 이상이면 활성화되고, 특정 값을 넘지 못하면 활성화되지 않는다. [Activation Functions] 뉴런의 동작 방식을 이용해 Activation Function을 만들었다. [(Simple) XOR problem: linearly separable?] Activation Function을 이용하여 직접 Hardware를 구현했다. AND/OR 문제의 경우 선형적으로 구분이 가능하기에 쉽.. 2023. 8. 13. 엑셀로 해보는 탐색적 데이터 분석 [데이터 불러오기] mpg.txt 파일을 복사해서 엑셀에 붙여넣는다. 다음과 같이 엑셀에 데이터가 정리된다. [데이터 준비하기] 정리된 데이터에 표 서식을 적용하고, 수치형을 갖는 속성에 조건부 서식을 적용해보자. 엑셀의 조건부 서식은 각 셀 값에 따라 자동으로 서식을 결정해주는 기능으로, 클릭 한 번으로 값 분포를 한눈에 볼 수 있다. E열, H열, I열에 셀 값에 따라 색상이 달라지는 조건부 서식을 적용해보자. 실습 과정은 다음과 같다. 1. 워크시트의 데이터 전체를 선택한다. 2. 메뉴에서 표 서식을 선택한 후 적절한 모양을 선택한다. 3. 표 서식을 적용한다. 4. 서식을 적용할 셀의 범위를 선택한다. 5. 조건부 서식 메뉴에서 적절한 서식을 고른다. 6. 조건부 서식이 적용된 결과는 다음과 같다.. 2023. 8. 13. application and tips Learning rate, Data preprocessing, Overfitting [Learning rate] Gradient 데이터를 통해 모델을 만들어갈 때 Learning rate와 Gradient의 연관 관계를 통해 최적의 모델 값을 찾을 수 있다. -> Learning rate는 모델을 만들 때 필요한 설정 값인 hyper-parameter라고 할 수 있다. [Learning rate] Good and Bad Learning rate를 설정하는 값에 따라 학습할 때 다양한 값들이 나오게 된다. 1. Learning rate가 클 경우, Overshooting이 일어날 수 있다. 2. Learning rate가 작을 경우, 너무 많은 시간이 소비된다. 따라서 적절한 값의 Learning rate.. 2023. 8. 6. Softmax Classifier Lec [Multinomial classification] Binary classification: 두 개의 class를 구분할 수 있음 Multinomial classification: 여러 개의 class를 구분할 수 있음 왼쪽의 데이터를 그래프 상에 나타내면 오른쪽 그래프처럼 나타낼 수 있다. Binary classification만을 가지고도 Multinomial classification 구현이 가능하다. A인지 아닌지, B인지 아닌지, C인지 아닌지 구분하는 세 개의 각각 다른 classification으로 Multinomial classification을 구현하게 된다. 세 개의 각각 다른 classification이 존재하기에 이를 구현하기 위해서 세 개의 독립된 형태의 벡터를 가지고 행렬.. 2023. 8. 6. logistic_regression Lab [Classification] 0과 1의 두 가지 케이스로 나눠 설명할 수 있다. [Logistic vs Linear] Logistic: 두 가지 케이스로 구분할 수 있는 데이터로 흩어져 있는 모양을 보이고, 셀 수 있다. Linear: 수치형 데이터로 연속인 모양을 보이고, 측정할 수 있다. [Hypothesis Representation] Linear regression을 적용했을 때, 우리가 원하는 Logistic 형태의 데이터를 얻을 수 없다. 따라서 0과 1을 표현할 수 있는 새로운 수식이 필요하다. Y와 x를 토대로 나온 0과 1을 표현할 수 있는 모델을 Hypothesis라고 한다. Hypothesis를 만드는 과정 1. x를 입력 값으로 넣고 Linear function을 적용해서 .. 2023. 8. 6. 엑셀을 이용한 데이터 준비 pew.txt 파일을 복사해서 엑셀에 붙여넣는다. pew.txt 파일은 탭으로 구분된 파일이므로 텍스트 파일에서 복사해 엑셀에 붙여넣기만 하면 된다. 테이블의 각 속성이 서로 다른 소득 구간에 속하는 사람들의 분포를 나타내는 것을 알 수 있다. 이런 테이블은 분포를 한 눈에 보기는 편할지 몰라도, 데이터를 가지고 각종 연산이나 시각화를 하기에는 불편하다. 별도의 속성으로 존재해야 할 소득 구간이 속성의 이름으로 들어가 있고, 또한 수치가 아니라 구간의 형태를 띠기 때문이다. 즉, 이 데이터는 각 행이 개별 속성을 포함해야 한다는 표준 테이블의 원칙을 어기고 있다. 우선 소득 구간 속성을 수치형 속성으로 바꾸는 작업을 진행해주었다. 1행의 소득 구간을 수치형 속성으로 하나씩 바꿔 주었다. 주어진 데이터가 .. 2023. 8. 6. 이전 1 2 3 4 5 6 ··· 16 다음