전체 글

dotori Java
전공 지식 정리/인공지능

#7 머신러닝2

의사결정트리 : 머신러닝에서 지도학습의 알고리즘이다. 분류 또는 회귀 분석 목적으로 사용한다. 목표 변수 유형에 따른 의사결정트리 범주형 목표 변수(출력 타입이 이산형) : 분류 트리 연속형 목표 변수(출력 타입이 연속형) : 회귀 트리 의사결정트리 구성요소 - 루트 노드 : 트리 구조가 시작되는 노드 - 부모 노드 : 자식 노드의 상위 노드 - 자식 노드 : 하나의 노드로부터 분리되어나간 2개 이상의 노드들 - 터미널 노드 : 트리 줄기 끝에 위치하고 자식 노드가 없는 노드 - 가지 : 루트 노드로부터 터미널 노드까지 연결된 마디들 - 깊이 : 루트 노드로부터 터미널 노드를 이루는 층의 수 의사결정트리 생성 시 고려사항 어떤 기준으로 규칙 만들어야 가장 효율적인 분류가 될 것인가가 알고리즘 성능 크게 ..

전공 지식 정리/인공지능

#6,7 은닉 마르코프 모델, 머신러닝

은닉 마르코프 모델 : 순차데이터를 확률적으로 모델링하는 생성 모델 마르코프 모델 : 상태로 이루어진 Sequence를 상태전이확률로 표현한 것 마르코프 가정 : 시간 t에서 관측은 가장 최근 r개의 관측에만 의존한다는 가정 A 상태전이확률 행렬, B 방출확률 행렬 ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ 인공지능 : 사람이 해야할 일을 기계가 대신할 수 있는 모든 자동화에 해당한다. 머신러닝 : 명시적으로 규칙을 프로그래밍 하지 않고 데이터로부터 의사결정을 위한 패턴을 스스로 학습한다. 딥러닝 : 인공신경망 기반의 모델로, 비정형 데이터로부터 특징 추출 및 판단까지 기계가 한 번에 수행한다. 프로그래밍 vs. 머신러닝 전통적인 프로그래밍 : 데이터와 규칙이 결합하여 출력을 생성한다. 규칙/로직(..

전공 지식 정리/인공지능

#4,5 불확실성 및 확률 / 베이지안 네트워크

불확실성 : Agent의 KB에서 명시적으로 고려되지 않은 모든 것을 의미한다. 불확실성의 종류 - 사전지식에 대한 불확실성 - Action에 대한 불확실성 - Perception에 대한 불확실성 불확실성을 처리하기 위한 방법 - Default Reasoning - Worst-case Reasoning - Probabilistic Reasoning : 현실 세계는 정상, 비정상으로 나뉘지 않고 모든 상황에는 다양한 확률이 존재한다. Logic이 불확실성을 처리할 수 없는 이유 게으름 : 모든 complete한 규칙을 모두 리스트화 할 수 없다. 이론적 무지 : complete한 이론은 없다. 실제적인 무지 : 모든 테스트를 수행할 수 없다. 확률은 게으름과 무지에서 오는 불확실성을 요약하며 문제를 해결하..

전공 지식 정리/유닉스

#2 파일과 디렉토리 - at, sleep, batch

at 명령어 : 사용자가 원하는 특정 시간에 유닉스 명령어 실행 및 메세지 전달하는 명령어다. 통상 모든 사용자가 at 명령을 사용할 수 없으며 시스템 관리자가 at 명령을 사용할 수 있게 조치해주면 그때부터 일반 사용자는 at 명령어 사용 가능하다. $ at 시간 [날짜] at -r 작업번호 at -l 작업번호 ... -r : 현재 at 명령어 수행을 위해 스케줄된 작업을 삭제한다. -l : 사용자 호출을 위해 스케줄된 모든 작업을 출력한다. 11시 11분에 who 명령 수행하여 그 수행 결과를 daram1이라는 파일에 저장하고, ls -l 이라는 명령을 수행해 daram2라는 파일에 저장 ) [다람쥐]$> at 11:11 who > daram1 ls -l > daram2 ^D 이렇게 더 이상 명령어가..

전공 지식 정리/유닉스

#2 파일과 디렉토리 - 컴파일, 파이프라인, 백그라운드 작업

C 프로그램 컴파일하기 유닉스 시스템은 대부분 C언어로 개발되어있고, C언어 개발환경이 기본적으로 탑재되어 있다. cc 명령어는 C프로그램을 컴파일하기 위한 유닉스 표준 C컴파일러다. IBM에서는 cc컴파일러 대신 gcc컴파일러를 사용한다. $ cc [옵션] 파일명 $ /usr/bin/gcc ./파일명 dotori1 $ grep daram dotori1 > dotori2 $ sort +2nr dotori2 > dotori3 $ lpr dotori3 $ rm dotori[123] 지금 사용하고 있는 디렉토리 파일을 할당된 블럭 개수 순으로 출력 ) $ ls -s | sort -n 현재 디렉토리 파일 목록을 소문자 대문자 구분 없이 정렬하여 화면으로 출력 ) $ ls | sort -f tee 명령어 : 파이..

전공 지식 정리/유닉스

#2 파일과 디렉토리 - tar, od, 파일 압축

tar 명령 : 파일시스템을 테이프 백업 장치로 백업하기 위해 사용하는 명령어다. $ tar[옵션] 저장매체 [백업할 파일이나 디렉토리 목록] tar 명령 옵션 -c : 저장매체를 초기화하고 주어진 파일 목록을 저장매체로 저장한다. -f : 첫 번째 인수가 아카이브 저장할 파일 이름이라는 것을 알려준다. f옵션 사용하지 않을 시 /dev/rmt0 라 부르는 자기 테이프 장치로 설정한다. -t : tar 아카이브에 저장되어 있는 파일과 디렉토리 내용을 표준출력으로 출력한다. -r : 주어진 매체 끝에서부터 주어진 파일 목록을 추가한다. -v : tar 명령을 수행함에 있어 발생하는 세세한 정보를 모두 출력한다. -x : 주어진 아카이브로부터 지정된 파일을 추출한다. 현재 디렉토리에 있는 모든 파일을 lis..

전공 지식 정리/유닉스

#2 파일과 디렉토리 - paste, dd, cpio

paste 명령어 : 사용자가 지정하는 2개 이상의 파일에 대해 같은 라인끼리(같은 필드) 합치는 명령어다. $ paste [옵션] 파일1 파일2 ... 메타문자를 이용한 병합 (wild-card 문자를 Unix에서는 메타문자라고 한다.) $ paste p[123] file1-1line file2-1line file3-1line file1-2line file2-2line file3-2line 메타문자 사용 x 개개의 파일 직접 전달 $ paste p1 p2 p3 file1-1line file2-1line file3-1line file1-2line file2-2line file3-2line -d 옵션 : 탭 문자를 사용하지 않고 다른 대체 문자를 지정할 수 있다. $ paste -d: p[123] file..

전공 지식 정리/유닉스

#2 파일과 디렉토리 - split, grep, egrep, tr, cut

split 명령어 : 큰 파일을 일정한 크기의 여러 개의 파일로 분할하는 명령어다. $ split[옵션] 파일명 옵션을 지정하지 않으면 일반적으로 1000라인씩 분할해 저장한다. 저장되는 파일 이름은 aa부터 zz까지 첨자가 붙으며 출력파일명을 지정하지 않으면 Xaa Xab ... 형태로 지정된다. $ split daramg.c $ls daramg.c Xaa Xab Xac 100라인 씩 분할 예) $ split -100 daramg.c grep 명령어 : 특정한 패턴을 검색하기 위한 명령어입니다. $ grep [옵션] 패턴 [파일명] grep 명령 옵션 -b : 찾는 각 라인 앞에 블록 번호 붙여 출력 -c : 찾는 라인 내용 출력하지않고 라인 수만 출력한다. -h : 대응하는 라인 출력할 때 파일의 이..

daramG
다람쥐의 개발 블로그