전체 글(14)
-
mnist를 이용해 손글씨 판별모델 실습
cpu노트북인 관계로 구글 코랩환경에서 진행하겠습니다. 구글코랩에서 런타임-런타임 유형변경-TPU import tensorflow as tf print("TensorFlow version:", tf.__version__) 버전확인을 해준뒤 TensorFlow version: 2.12.0 mnist 손글씨 데이터를 불러와줍니다. mnist = tf.keras.datasets.mnist (x_train, y_train), (x_test, y_test) = mnist.load_data() x_train, x_test = x_train / 255.0, x_test / 255.0 10까지의 train개수 확 import matplotlib.pyplot as plt import numpy as np img = np..
2024.02.14 -
딥러닝의 이해
지도학습(x:원인, y:결과) 예측: y값을 예측 분류: y값이 어떤곳에 속해있는지를 선택(분류) 둘중하나(이항분류: 생존1,사망0) 결과값은 0또는 1의 값으로만 출력되어야만함 네이버 영화평 긍정1,부정0 학습할떄는 y값으로 0또는 1값을 학습하지만 분류값으로 머신러닝이나 딥러닝한값은 0~1사이값이 출력이 되도록함, 0.5(임계값)보다 크면 1, 그렇지 않으면 0으로 최종값이 되게끔 계산 기본식은 x*w+b 대표적인 회귀분석 머신러닝f(x) 계산하는 방법이 고정이어서 오차계산 없음 이미 오차가 최소화되는 최소제곱법에 의해서 w,b가 계산이됨 딥러닝은 w,b를 무작위로 만들어서 계산한뒤(w*x+b), 오차계산하고 최소화 될 수 있게 경사하강(미분), 이과정 반복(사용자가 에포크지정한 횟수만큼) x y f..
2024.02.13 -
품질경영기사(2022. 4. 24.) 기출풀이
1과목 실험계획법 1. 다음은 A, B, C의 요인으로 각 2수준계 8조의 23 형 요인실험을 랜덤으로 행한 데이터이다. 이 때 SA의 값은? SSA=n×((XA0−Xtotal)^2+(XA1−Xtotal)^2) A0=19/ 4= 4.75 A1=29/ 4=7.25 전체평균 = 6 n(반복)은 4번 요인 A의 두 수준 A0과 A1의 평균 반응값은 각각 4.75와 7.25입니다. 모든 값의 총 평균은 6.0이고, 이를 바탕으로 계산한 요인 A의 제곱합(Sum of Squares for Factor A, SSA)은 12.5입니다. 2. 23형의 교락법에서 인수분해식을 이용하여 단독교락을 실시하려 할 때의 설명 중 틀린 것은? ① 블록이 2개로 나누어지는 교락을 의미한다. ② (1)을 포함하지 않는 블..
2024.02.13 -
속도를 높이는 재귀 알고리즘(퀵정렬)
퀵 정렬 퀵 정렬은 분할과 재귀로 이뤄진다. 분할 분할은 임의의 피벗값(주로 제일 마지막 인덱스)을 정하여 피벗값을 기준으로 작은값들은 왼쪽, 큰값들은 오른쪽에 위치하도록 배열을 구분하는 작업이다. 피벗값을 기준으로 큰지 작은지만 구분이 되면 충분하며, 구분된 한 쪽이 온전히 정렬되어 있지 않아도 좋다. 재귀 분할이 1회 완료되면 피벗값을 기준으로 왼쪽배열, 오른쪽 배열로 구분된다. 그러면 이때 재귀로직이 들어간다. 왼쪽과 오른쪽 배열에 대해서 각각 분할과정을 실행하는 것이다. 그리고 배열이 완전히 정렬 될 때까지 재귀적으로 반복해서 실행한다. 최하위까지 완료되면 배열은 온전히 정렬되어있다. 퀵 정렬의 효율성 퀵 정렬 단계 수N x LogN 8 8 24 24 64 64 160 160 위 표를 보면 알 수..
2024.02.13 -
연관규칙 분석(apriori)/ 장바구니 분석
연관분석의 이해 필요한 모듈을 설치해줍니다. pip install mlxtend import pandas as pd from mlxtend.preprocessing import TransactionEncoder from mlxtend.frequent_patterns import apriori, association_rules # mlxtend : 일상적인 데이터 사이언스 작업에 유용한 도구들로 구성된 파이썬 라이브러리 # fit() # dataset에 있는 모든단어를 중복제거한뒤(unique) # a~z까지 sort한뒤 인덱스 번호를 부여 # 컬럼이 첫번째 단어, 두번째단어, 세번째단어, 네번째단어 # transform # dataset에 있는 각 단어에 fit에 있는 번호에 해당하는지를 작업 # 예) ..
2024.02.08 -
[02.08] 법원 판례 데이터 자연어처리
원본 데이터 930MB라 올리진 못하겠다.. import pandas as pd # plt.style.use('seaborn') # plt.rcParams['figure.figsize'] = [14,14] # 데이터 불러오기 path = (r'C:\Users\bluecom011\Desktop\Sesac_AI\7주차\02.07\judicial_precedent_All_encoding.csv') df = pd.read_csv(path)[:3000] df.head() # df.tail() df,info()로 정보보기 object인 컬럼만 골라보기 #df. info의 type이 object인 자료만 걸러냄 object_columns = df.select_dtypes(include=['object']).colum..
2024.02.08