본문 바로가기

전체 글98

문제 해결 프로그래밍 입문 ⑩ 리스트, 튜플, 리스트와 튜플 비교 1. 리스트- 리스트의 기본 구조 : 시퀀스 객체, 문자열와 유사, 위치 정보가 있음, 슬라이싱 가능, 가변적, 대괄호 혹은 list()로 정의- 리스트 인덱싱 : 특정 위치의 원소를 참조하는 방법, 음수를 사용하면 뒤에서 부터 찾기 가능- 리스트 슬라이싱 : 리스트의 연속된 일부분을 추출하는 방법, 리스트[start:end] start부터 end-1까지 호출됨- 리스트 step 사용 : 리스트[start:end:step] step에 몇칸씩 건너뛸지 입력, -1 입력 시 뒤집어서 추출- 리스트 언패킹 : 리스트의 원소를 여러 변수에 한번에 할당하는 방법, +를 사용해서 나머지 원소를 리스트로 저장 가능fruit = [3, 'apple','orange','banana']n, a, b, c = fruitpr.. 2024. 11. 11.
빅데이터 분석 실무 ⑩ 서포트백터머신, 연관 분석, 군집 분석 1. 서포트백터머신(1) 서포트 백터 머신의 이해- 선형과 비선형 분류, 회귀 예측 및 이상값 분류에도 사용할 수 있고, 패턴 인식 자료 분석 등에 활용되는 지도 학습 알고리즘- 특징 > 지도 학습에서 과적합을 회피할 수 있는 방법 > 분류(종속변수 : 범주형), 회귀(종속변수 : 연속형)의 문제 활용 > 인공 신경망 대비 사용이 쉬움 > 학습 속도가 느리고 해석의 어려움 존재- 초평면에 가장 가깝게 위치한 값을 서포트 벡터라고 함- 최대 마진을 가지는 선형 판별에 기초, 속성들 간 의존성은 고려하지 않음- 데이터 공간에서 근접한 데이터와 거리가 큰 경계(마진)을 식별 - 새로운 데이터가 경계 밖, 어느 범주에 속하는지 분류- 회귀 문제 적용을 위해 종속변수가 범주형일 경우, SVM을 사용, 연속형일 경.. 2024. 11. 9.
코딩 테스트 입문 ⑩ 집합, 딕셔너리 1. 집합30525704import sys import math input = sys.stdin.readline l = [] for i in range(10) :     a = int(input())     if a%42 not in l :         l.append(a%42) print(len(l))import sys import math input = sys.stdin.readline while 1:     a = input().rstrip()     if a == '*' :         break     l = [0] * 26     for x in a :         if x == ' ':             continue         k = ord(x) - 97         l[k.. 2024. 11. 8.
빅데이터 기초 프로그래밍 ⑨ 이터레이터 개념과 활용, 제너레이터 개념과 활용, 빅데이터 데이터셋 이해 1. 이터레이터 개념과 활용(1) Iterable과 Iterator 이해- Iterable : 반복 가능한- Iterator : 반복 가능한 객체(Container 개념의 객체 모두) 반복문 또는 특정 함수를 이용하여 데이터를 하나씩 가져올 수 있는 객체(순서대로) > 반드시 alist.__iter__(), alist.__next__()==next(alist) 메소드를 제공해야 함 > next로 넘어가면, 그 전의 데이터를 삭제해 전 데이터를 가져올 수 없음, 그래서 데이터를 적게 쓸 수 있음 > Iterable 객체인지 확인하는 방법 : isinstance(a_list, Iterable)- Container : 여러개의 값을 갖는 구조, list, tuple, 문자열, dictionary가 Contai.. 2024. 11. 8.
데이터 모델링과 SQL ⑨ 서브 쿼리, 집합 연산자, 그룹 함수, 윈도우 함수, Top N 쿼리 1. 서브 쿼리(1) 서브 쿼리 의미 및 특징- 하나의 SQL 문 안에 포함되는 또 다른 SQL을 의미- 메인 쿼리의 모든 칼럼을 사용할 수 있지만, 메인 쿼리는 서브 쿼리의 칼럼을 사용할 수 없음- 원하는 결과에 따라 조인 방식, 함수 등의 방식으로 변환해야 함- 주의 사항 : 괄호로 감싸서 사용, 단일행 또는 복수행 비교 연산자와 함께 사용 가능, ORDER BY절과 사용 불가(2) 서브 쿼리 분류- 동작 방식에 따른 분류 > 비 연관 서브 쿼리 : 서브 쿼리가 메인 쿼리 컬럼을 가지고 있지 않은 형태, 메인 쿼리에 값을 제공하기 위한 목적으로 주로 사용 > 연관 서브 쿼리 : 서브 쿼리가 메인 쿼리의 컬럼을 가지고 있음, 주로 서브 쿼리 조건을 확인할 때 사용- 반환되는 데이터 형태에 따른 분류 >.. 2024. 11. 7.