파이썬
[Python 파이썬] 집합 자료형 set의 특징과 수학적 연산
Life4AI
2024. 5. 22. 15:07
파이썬에서의 집합 자료형 set과 합집합, 교집합, 차집합, 대칭차집합에 대해 알아보고자 한다.
<목차>
- 집합 자료형 set
- Set 관련 함수 - 값 추가 및 제거
- 값 1개 추가 - add
- 값 여러 개 추가 - update
- 특정 값 제거 - remove
- Set의 수학적 연산
- 합집합
- 교집합
- 차집합
- 대칭차집합
집합 자료형 set
Set은 고유한 원소들의 집합을 나타내는 데이터 구조이다.
다음과 같이 set 키워드를 사용해 만들 수 있다.
s1 = set([1,2,3,3,3])
print(s1) # {1, 2, 3}
s2 = set('HELLO')
print(s2) # {'O', 'E', 'H', 'L'}
결과를 보면, 순서도 뒤죽박죽이고, 중복이 있던 원소들은 하나를 제외하고 빠져있다.
그 이유는 set에 다음과 같은 특징이 있기 때문이다.
- 고유한 원소들: Set은 중복된 원소를 허용하지 않는다. 각 원소는 유일해야 한다.
- 순서가 없음(unordered): Set은 원소들의 순서를 유지하지 않는다. 즉, 인덱스나 순서로 원소에 접근할 수 없다.
- 가변성(Mutable): Set은 가변형이므로 원소를 추가하거나 제거할 수 있다.
- 수학적 연산 지원: Set은 합집합, 교집합, 차집합과 같은 수학적 연산을 지원한다.
Set 관련 함수 - 값 추가 및 제거
값 1개 추가 - add
set형에 값을 추가할 수 있다. 값 1개만 추가할때는 add를 사용하여 다음과 같이 하면 된다.
s1 = set([1,2,3,4])
s1.add(10)
s1.add(20)
print(s1) # {1, 2, 3, 4, 10, 20}
값 여러 개 추가 - update
여러 개의 값을 한꺼번에 추가할 때는 update를 사용하여 다음과 같이 하면 된다.
s1 = set([1,2,3,4])
s1.update([10,20])
print(s1) # {1, 2, 3, 4, 10, 20}
특정 값 제거 - remove
특정 값을 제고하고 싶을 때는 remove를 사용하여 다음과 같이 하면 된다.
s1 = set([1,2,3,4])
s1.remove(3)
print(s1) # {1, 2, 4}
set의 수학적 연산
합집합
'|'를 이용하면 집합을 간단히 구할 수 있고, 'union() 함수'를 사용해도 결과는 동일하다.
a = [1,2,3,4,5]
b = [1,2,3,10,20]
union = list(set(a) | set(b))
print(union) # [1, 2, 3, 4, 5, 10, 20]
union = set().union(a,b)
print(union) # {1, 2, 3, 4, 5, 10, 20}
union = list(set().union(a,b))
print(union) # [1, 2, 3, 4, 5, 10, 20]
교집합
'&'를 이용하면 교집합을 간단히 구할 수 있고, 'intersection() 함수'를 사용해도 결과는 동일하다.
a = [1,2,3,4,5]
b = [1,2,3,10,20]
intersection = list(set(a) & set(b))
print(intersection) # [1, 2, 3]
intersection = set(a).intersection(b)
print(intersection) # {1, 2, 3}
intersection = list(set(a).intersection(b))
print(intersection) # [1, 2, 3]
차집합
'-(빼기)'를 이용하면 차집합을 간단히 구할 수 있고, 'difference() 함수'를 사용해도 결과는 동일하다.
a = [1,2,3,4,5]
b = [1,2,3,10,20]
subtractionA_B = list(set(a) - set(b))
print(subtractionA_B) # [4, 5]
subtractionB_A = list(set(b) - set(a))
print(subtractionB_A) # [10, 20]
subtractionA_B2 = list(set(a).difference(b))
print(subtractionA_B) # [4, 5]
subtractionB_A2 = list(set(b).difference(a))
print(subtractionB_A) # [10, 20]
대칭차집합
'^를 이용하면 대칭차집합을 간단히 구할 수 있고, 'symmetric_difference() 함수'를 사용해도 결과는 동일하다.
a = [1,2,3,4,5]
b = [1,2,3,10,20]
symmetricDifference1 = list(set(a) ^ set(b))
print(symmetricDifference1) # [4, 5, 10, 20]
symmetricDifference2 = list((set(a)|set(b)) - (set(a)&set(b))) # 합집합 - 교집합
print(symmetricDifference2) # [4, 5, 10, 20]
symmetricDifference3 = list(set(a).symmetric_difference(b))
print(symmetricDifference3) # [4, 5, 10, 20]