문제 설명
[본 문제는 정확성과 효율성 테스트 각각 점수가 있는 문제입니다.]
카카오는 하반기 경력 개발자 공개채용을 진행 중에 있으며 현재 지원서 접수와 코딩테스트가 종료되었습니다. 이번 채용에서 지원자는 지원서 작성 시 아래와 같이 4가지 항목을 반드시 선택하도록 하였습니다.
코딩테스트 참여 개발언어 항목에 cpp, java, python 중 하나를 선택해야 합니다.
지원 직군 항목에 backend와 frontend 중 하나를 선택해야 합니다.
지원 경력구분 항목에 junior와 senior 중 하나를 선택해야 합니다.
선호하는 소울푸드로 chicken과 pizza 중 하나를 선택해야 합니다.
인재영입팀에 근무하고 있는 니니즈는 코딩테스트 결과를 분석하여 채용에 참여한 개발팀들에 제공하기 위해 지원자들의 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인 지 쉽게 알 수 있는 도구를 만들고 있습니다.
예를 들어, 개발팀에서 궁금해하는 문의사항은 다음과 같은 형태가 될 수 있습니다.
코딩테스트에 java로 참여했으며, backend 직군을 선택했고, junior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 50점 이상 받은 지원자는 몇 명인가?
물론 이 외에도 각 개발팀의 상황에 따라 아래와 같이 다양한 형태의 문의가 있을 수 있습니다.
코딩테스트에 python으로 참여했으며, frontend 직군을 선택했고, senior 경력이면서, 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
코딩테스트에 cpp로 참여했으며, senior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
backend 직군을 선택했고, senior 경력이면서 코딩테스트 점수를 200점 이상 받은 사람은 모두 몇 명인가?
소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 250점 이상 받은 사람은 모두 몇 명인가?
코딩테스트 점수를 150점 이상 받은 사람은 모두 몇 명인가?
즉, 개발팀에서 궁금해하는 내용은 다음과 같은 형태를 갖습니다.
- [조건]을 만족하는 사람 중 코딩테스트 점수를 X점 이상 받은 사람은 모두 몇 명인가?
문제
지원자가 지원서에 입력한 4가지의 정보와 획득한 코딩테스트 점수를 하나의 문자열로 구성한 값의 배열 info, 개발팀이 궁금해하는 문의조건이 문자열 형태로 담긴 배열 query가 매개변수로 주어질 때,
각 문의조건에 해당하는 사람들의 숫자를 순서대로 배열에 담아 return 하도록 solution 함수를 완성해 주세요.
제한사항
1. info 배열의 크기는 1 이상 50,000 이하입니다.
2. info 배열 각 원소의 값은 지원자가 지원서에 입력한 4가지 값과 코딩테스트 점수를 합친 "개발언어 직군 경력 소울푸드 점수" 형식입니다.
3. 개발언어는 cpp, java, python 중 하나입니다.
4. 직군은 backend, frontend 중 하나입니다.
5. 경력은 junior, senior 중 하나입니다.
6. 소울푸드는 chicken, pizza 중 하나입니다.
7. 점수는 코딩테스트 점수를 의미하며, 1 이상 100,000 이하인 자연수입니다.
8. 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
9. query 배열의 크기는 1 이상 100,000 이하입니다.
10. query의 각 문자열은 "[조건] X" 형식입니다.
11. [조건]은 "개발언어 and 직군 and 경력 and 소울푸드" 형식의 문자열입니다.
12. 언어는 cpp, java, python, - 중 하나입니다.
13. 직군은 backend, frontend, - 중 하나입니다.
14. 경력은 junior, senior, - 중 하나입니다.
15. 소울푸드는 chicken, pizza, - 중 하나입니다.
16. '-' 표시는 해당 조건을 고려하지 않겠다는 의미입니다.
17. X는 코딩테스트 점수를 의미하며 조건을 만족하는 사람 중 X점 이상 받은 사람은 모두 몇 명인 지를 의미합니다.
18. 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
19. 예를 들면, "cpp and - and senior and pizza 500"은 "cpp로 코딩테스트를 봤으며, 경력은 senior 이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 500점 이상 받은 사람은 모두 몇 명인가?"를 의미합니다.
입출력 예시
info | query | result |
---|---|---|
["java backend junior pizza 150","python frontend senior chicken 210","python frontend senior chicken 150","cpp backend senior pizza 260","java backend junior chicken 80","python backend senior chicken 50"] | ["java and backend and junior and pizza 100","python and frontend and senior and chicken 200","cpp and - and senior and pizza 250","- and backend and senior and - 150","- and - and - and chicken 100","- and - and - and - 150"] | [1,1,1,1,2,4] |
입출력 예 설명
지원자 정보를 표로 나타내면 다음과 같습니다.
언어 | 직군 | 경력 | 소울 푸드 | 점수 |
---|---|---|---|---|
java | backend | junior | pizza | 150 |
python | frontend | senior | chicken | 210 |
python | frontend | senior | chicken | 150 |
cpp | backend | senior | pizza | 260 |
java | backend | junior | chicken | 80 |
python | backend | senior | chicken | 50 |
"java and backend and junior and pizza 100" : java로 코딩테스트를 봤으며, backend 직군을 선택했고 junior 경력이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 100점 이상 받은 지원자는 1명 입니다.
"python and frontend and senior and chicken 200" : python으로 코딩테스트를 봤으며, frontend 직군을 선택했고, senior 경력이면서 소울 푸드로 chicken을 선택한 지원자 중 코딩테스트 점수를 200점 이상 받은 지원자는 1명 입니다.
"cpp and - and senior and pizza 250" : cpp로 코딩테스트를 봤으며, senior 경력이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 250점 이상 받은 지원자는 1명 입니다.
"- and backend and senior and - 150" : backend 직군을 선택했고, senior 경력인 지원자 중 코딩테스트 점수를 150점 이상 받은 지원자는 1명 입니다.
"- and - and - and chicken 100" : 소울푸드로 chicken을 선택한 지원자 중 코딩테스트 점수를 100점 이상을 받은 지원자는 2명 입니다.
"- and - and - and - 150" : 코딩테스트 점수를 150점 이상 받은 지원자는 4명 입니다.
풀이 코드
이건 대체 무슨 문제인가 .... 분명 이진 탐색 카테고리에 있는 문제인데 어째서 이게 이진 탐색이지 ... 라는 생각을 수 없이 반복하다 책 풀이를 보고 이해하는데 초점을 맞춘 문제. 아직도 이게 왜 Level 2 문제인지 이해할 수는 없다.
전체 코드는 이렇다. 잘라서 하나씩 보자.
from collections import defaultdict
from itertools import combinations
from bisect import bisect_left
def solution(info, query):
answer = []
# 점수에 따른 모든 경우의 수를 추출 해야한다.
# javabackendjuniorpizze : [150], java : [150], java backend : [150] ...
people = defaultdict(list)
for i in info:
person = i.split()
# value 값으로 사용할 점수 추출
score = int(person.pop())
# 가장 기초가 되는 조합 먼저 people 딕셔너리에 추가
people[''.join(person)].append(score)
# 언어, 직군, 경력, 소울푸드 4가지 경우에 맞는 모든 경우의 수 찾기
for j in range(4):
case = list(combinations(person, j))
# 기초가 되는 조합 제외 모든 경우의 수를 people 딕셔너리에 추가
for c in case:
people[''.join(c)].append(score)
# people 딕셔너리의 value(score) 성적을 모두 정렬
for key in people:
people[key].sort()
for q in query:
q_key = q.split()
score = int(q_key.pop())
q_key = ''.join(q_key)
q_key = q_key.replace('-', '').replace('and', '').replace(' ', '')
# 질의에서 뽑아온 key = 'javabackendjuniorpizza', score - [100] 라고 가정
# 해당 key 로 people[key] 검색 시 몇 명이 각 몇 점인지 알 수 있다.
# 위 예시로는 people 애서 검색했을 때 score - [150] 이란 것을 알 수 있다.
# 요구사항으로 score - [100] 점 이상 받은 사람이 몇 명인지 알아내야하므로
# bisect_left 를 사용해 하한선을 알아낸 뒤 전체 길이에서 빼주면 된다.
# 즉, people[key] : [150] 일 때 bisect_left 은 0 번째로 나오고, 전체 길이는 1이니
# [100] 점 보다 높은 인원수가 1명이 된다.
answer.append(len(people[q_key]) - bisect_left(people[q_key], score))
return answer
우리 목표는 [4가지 조건 (언어, 직군, 경력, 소울푸드)] 을 만족하는 사람 중 X 점 이상의 테스트 점수를 받은 사람을 추려내야하는 것이다. 풀이대로 설명하자면 info 의 행 하나를 가지고 테스트 점수를 제외한 4가지 조건의 조합을 key 로, value 로는 테스트 점수를 가지는 딕셔너리를 만들어준다.
예를 들어, info[i] = 'java backend junior pizza 150' 이라면, 테스트 점수인 150 을 제외한 나머지 언어, 직군, 경력, 소울푸드로 combinations 조합을 만들어준다. 이러면 4C1, 4C2, 4C3, 4C4 총 16 가지의 경우의 수를 뽑아낼 수 있다.
'': [150], 'java': [150], 'backend': [150], 'junior: [150]', 'pizza: [150]', 'javabackend': [150] ~ 이런식으로 ..
query (질의)에서 4가지의 조건을 모두 필수적으로 적는게 아니라 '-' 로 생략할 수 있기 때문에 모든 경우의 수를 딕셔너리에 저장해둔 것이고, for i in info: ~ 로직을 통해 모든 info[i] 의 조합을 people 딕셔너리에 추가한 결과는 아래와 같다.
defaultdict(<class 'list'>, {'javabackendjuniorpizza': [150], '': [150, 210, 150, 260, 80, 50], 'java': [150, 80], 'backend': [150, 260, 80, 50], 'junior': [150, 80], 'pizza': [150, 260], 'javabackend': [150, 80], 'javajunior': [150, 80], 'javapizza': [150], 'backendjunior': [150, 80], 'backendpizza': [150, 260], 'juniorpizza': [150], 'javabackendjunior': [150, 80], 'javabackendpizza': [150], 'javajuniorpizza': [150], 'backendjuniorpizza': [150], ... 중략} |
from collections import defaultdict
from itertools import combinations
from bisect import bisect_left
def solution(info, query):
answer = []
# 점수에 따른 모든 경우의 수를 추출 해야한다.
# javabackendjuniorpizze : [150], java : [150], java backend : [150] ...
people = defaultdict(list)
for i in info:
person = i.split()
# value 값으로 사용할 점수 추출
score = int(person.pop())
# 가장 기초가 되는 조합 먼저 people 딕셔너리에 추가
people[''.join(person)].append(score)
# 언어, 직군, 경력, 소울푸드 4가지 경우에 맞는 모든 경우의 수 찾기
for j in range(4):
case = list(combinations(person, j))
# 기초가 되는 조합 제외 모든 경우의 수를 people 딕셔너리에 추가
for c in case:
people[''.join(c)].append(score)
... 중략
'-' 로 생략되는 등 모든 경우의 수가 people 딕셔너리에 저장되었다면, 이제 query (질의)를 돌면서 우리의 목적인 [4가지 조건 (언어, 직군, 경력, 소울푸드)] 을 만족하는 사람 중 X 점 이상의 테스트 점수를 받은 사람을 추려낼 수 있다.
info 반복문과 비슷하게 query[i] 를 가져와서 역시 테스트 점수는 뽑아두고 뭉쳐진 q_key 문자열에서 '-', 공백, 'and' 문자열을 지워준다.
이제 people 딕셔너리에 q_key 를 key 값으로 집어넣는다면 질의에 알맞는 테스트 점수가 몇 개 존재하는지, 몇 점인지 파악할 수 있게 되었다.
예를들어,
key = 'javabackendjuniorpizza', value = [150] ... 중략} 이 있고,
q_key = 'javabackendjuniorpizza', score = [100] 이라고 가정해보면,
현재 질의(q_key) 를 했을 때 질의의 4가지 조건을 만족하는 (생략된 조건 포함) 점수는 총 1명, 150점인 것을 알 수 있다. 또한 현재 질의는 질의 조건을 만족하는 100점 이상의 사람 수는 몇 명인가? 를 묻고 있으므로 bisect_left 하한선을 활용해 질의의 점수 100점 보다 더 높은 인원이 몇 명인지 알 수 있다.
위 예에서,
len(people[q_key]) = 1 (1명)
bisect_left(people[q_key], score)) = 현재 질의에 맞는 점수들 중 100 점은 몇 번째인가 ? = 0 번째
즉, 현재 질의에 맞는 점수 개수 에서 현재 질의의 점수가 몇 번째? 를 빼주면 현재 질의의 점수보다 더 높은 점수가 몇 개인지 알 수 있다.
말이 좀 이상한데;; 만약에 현재 질의에 맞는 점수들이 [100, 200, 250, 300] 4개 있고 현재 질의의 점수가 230 이라고 가정하면, 전체 점수 길이 4 에서 2 를 빼준 2 가 230 보다 더 높은 점수 개수가 되는 것 (250, 300 이렇게 2개 있으니까)ㅎㅎ;;
하한선을 활용해서 이진 탐색 쪽으로 챕터가 나눠진 것 같은데 어떻게 이런 생각을 하지 싶은 문제였다. 점수 목록에서 bisect_left 를 사용한 것도 이진 탐색을 활용한 것이니 people[key].sort() 정렬하는 것을 잊지 말도록 하자
from collections import defaultdict
from itertools import combinations
from bisect import bisect_left
def solution(info, query):
answer = []
... 중략
# people 딕셔너리의 value(score) 성적을 모두 정렬
for key in people:
people[key].sort()
for q in query:
q_key = q.split()
score = int(q_key.pop())
q_key = ''.join(q_key)
q_key = q_key.replace('-', '').replace('and', '').replace(' ', '')
# 질의에서 뽑아온 key = 'javabackendjuniorpizza', score - [100] 라고 가정
# 해당 key 로 people[key] 검색 시 몇 명이 각 몇 점인지 알 수 있다.
# 위 예시로는 people 애서 검색했을 때 score - [150] 이란 것을 알 수 있다.
# 요구사항으로 score - [100] 점 이상 받은 사람이 몇 명인지 알아내야하므로
# bisect_left 를 사용해 하한선을 알아낸 뒤 전체 길이에서 빼주면 된다.
# 즉, people[key] : [150] 일 때 bisect_left 은 0 번째로 나오고, 전체 길이는 1이니
# [100] 점 보다 높은 인원수가 1명이 된다.
answer.append(len(people[q_key]) - bisect_left(people[q_key], score))
return answer
'알고리즘 정리' 카테고리의 다른 글
파이썬(Python) 알고리즘 문제풀이 징검다리 건너기 [프로그래머스 / 이분탐색] (0) | 2023.07.10 |
---|---|
파이썬(Python) 알고리즘 문제풀이 징검다리 [프로그래머스 / 이분탐색] (0) | 2023.07.10 |
파이썬(Python) 알고리즘 문제풀이 입국 심사[프로그래머스 / 이분탐색] (1) | 2023.06.06 |
파이썬(Python) 알고리즘 문제풀이 가장 큰 수[프로그래머스 / 정렬] (0) | 2023.06.05 |
파이썬(Python) 알고리즘 문제풀이 문자열 내 마음대로 정렬하기 [프로그래머스 / 정렬] (0) | 2023.06.05 |