-
아래 질문은 실제로 제가 이직을 준비하면서 준비했던 데이터 엔지니어용 질문 모음입니다. 이직을 준비하시는 모든 분들께 도움이 되었으면 좋겠네요 :)
공통 질문
1. 간단하게 자기소개 해주실 수 있나요? (핵심역량, 주요성과, 지원동기)
2. 우리 회사에 지원하게 된 동기가 뭔가요?
3. 이직하려는 이유가 뭔가요?
4. 이전 회사에서 가장 힘들었던 점이 무엇인가요?
5. 해당 직군의 매력이 무엇이라고 생각하나요?
6. 해당 직군에서 본인의 장점은?
7. 해당 직군을 하면서 이루고자 하는 목표는?
8. 왜 저희가 지원자를 뽑아야 하나요?
9. 지원자의 장점과 단점은?
10. 데이터 엔지니어란 뭐라고 생각하시나요?
11. 전 직장에서 어떤 역할을 맡아서 진행하셨나요?
12. 가장 기억에 남는 프로젝트가 무엇인가요?
13. 프로젝트 도중에 갈등 상황이 있었던 적이 있나요? 해결방안은 무엇인가요?
14. 했던 프로젝트에서 보완하고 싶은 내용이 있나요?
15. 그렇다면 위를 어떻게 보완할 수 있을까요? 아이디어를 떠올려 보셨나요?
16. 회사 성장이 중요한가요 자신의 성장이 중요한가요?
17. k8s가 무엇인가요?
18. k8s를 썼을 때의 장점은 무엇인가요?
19. 그렇다면 도커는 무엇인가요?
20. 그럼 도커를 사용했을 때 장점이 뭔가요?
21. CI/CD가 무엇인가요?
22. 클라우드를 사용함으로써 얻는 이득이 뭐라고 생각하시나요?
23. ETL과 ELT의 차이에 대해 설명해보세요
24. Data Warehouse가 뭐야?
25. Data Lake와 Warehouse의 차이가 뭐야?
26. RDBMS와 NoSQL의 차이가 뭐야?
27. ACID가 뭐야?
28. Airflow란 무엇인가요?
29. Hadoop Ecosystem에 대해 알고 있나요?
30. Spark란 무엇인가요?
31. 입사해서 진행해보고 싶은 프로젝트가 있나요?
32. 10년 뒤 어떤 개발자가 되고 싶나요?
33. 마지막 포부
Event Pipeline 관련 질문
1. Kafka란 무엇인가?
2. Kafka에서 consumer의 수를 파티션의 수보다 많이 할당하지 않는 이유가 뭐야?
3. 카프카 컨슈머 그룹의 리밸런싱 과정에 대해 설명해줘
4. 컨슈머의 파티션 할당 전략에 대해 설명해줘
5. Kafka에서 페이지 캐시를 하는 방법에 대해 알아?
6. Kafka에서 Zookeeper의 역할이 뭐야?
7. Kafka에서 leader와 Follower의 각각 역할이 뭐야?
8. 그럼 만약 리더의 데이터가 아직 팔로워들에게 동기화 되지 않았는데 리더가 crash나면 어떡해?
9. Kafka에서 리더와 팔로워 간의 replication 동작에 대해 설명해줘
10. 리더에포크의 역할에 대해 알아?
11. Zookeeper가 leader elect하는 과정을 설명해줘
12. knative가 뭐야?
13. knative serving이 뭐야?
14. istio가 뭐야?
15. Service Mesh Architecture가 뭐야?
16. ELK가 뭐야?
17. Elastic Search는 어떻게 검색을 빠르게 수행하는거야?
18. Events Pipeline을 관리할 때 Kafka를 어떻게 사용하였는지 한번 자세히 설명해주실 수 있나요?
19. Kafka와 Kinesis의 장단점이 뭐라고 생각하시나요?
20. ELK를 어떻게 구축하셨는지 설명해주세요
21. Prometheus의 alert manager를 활용하여 어떤 방식으로 alert를 발생했는지 설명해주세요
22. Prometheus가 뭔가요?
23. Terraform과 pulumi의 차이?
실시간 데이터 활용 관련 질문
1. ksql이 무엇인가요?
2. ksql을 사용하실 때 어떤 제약을 느끼셨나요?
3. kafka streams를 사용하면 어떻게 ksql에서의 제약을 해결할 수 있나요?
4. kafka streams를 활용하여 어떻게 pipeline을 구축하셨나요?
5. 데이터 타입으로 avro를 사용하셨는데 avro가 뭔가요?
6. avro가 데이터의 스키마가 시간이 지나면서 변할 수 있음을 고려하여 설계되었는데, 어떻게 오래된 스키마로 직렬화된 데이터도 새로운 스키마로 역직렬화 할 수 있는지에 대해 알려줘
Infrastructure 관련 질문
1. 수행했던 트러블슈팅 중 가장 기억 남는 트러블슈팅?
2. IaC의 장점과 단점이 뭐라고 생각하는가?
3. Blue Green Deployment에 대해 설명해주세요
4. Blue Green을 선택한 이유가 있나요? 다른 Rolling update나 Canary나 다른 배포 방법도 있을텐데
5. 데이터 백업 및 clean은 어떤식으로 하신건가요?
6. PostgreSQL의 장점?
7. 인덱스는 크게 Hash index와 B+ tree index가 있습니다. 이것은 무엇일까요?
8. Clustered index와 unclustered index는 뭐야?
9. 인덱스 scan 방식은 무엇이 있나요?
10. 인덱스 설계시 NULL값은 고려되어야 할까요?
11. Nested Loop join은 무엇인가요?
12. MySQL에서 대량의 데이터를 insert해야하는 경우엔 어떻게 해야할까요?
13. RDB의 char과 varchar의 차이는 무엇일까요?
14. 구글 BigQuery나 AWS의 Redshift는 기존 RDB와 무슨 차이가 있길래 빠를까요?
15. 쿼리의 성능을 확인하기 위해 어떤 쿼리문을 작성해야 할까요?
16. MySQL이 느리다는 신고가 들어오면 어떤걸 확인하고 조정하시겠나요?
17. 동작하는 MySQL에 alert table을 하면 안되는 이유를 설명해주세요. 대안을 설명해주세요
18. 빡세게 동작하고 있는 MySQL을 백업뜨기 위해서는 어떤 방법이 필요할까요?
19. MapReduce란 무엇인가요?
20. Spark가 Hadoop보다 빠른 이유를 I/O 최적화 관점에서 생각해봅시다.
21. RDD가 뭐야?
22. 동시성(concurrency)와 병렬성(parallel)의 차이가 뭐야?
23. 동기와 비동기의 차이?
24. 싱글스레드/멀티스레드 장단점
25. 스레드/프로세스 차이
'첫 이직기' 카테고리의 다른 글
데이터 엔지니어 이직 준비법 (3) - 코딩테스트 준비 (0) 2024.01.10 데이터 엔지니어 이직 준비법 (2) - 이력서 및 포트폴리오 작성 (1) 2024.01.10 데이터 엔지니어 이직 준비법 (1) - 계획 세우기 (0) 2024.01.10 라인 Data Platform Engineer 면접 후기 (2) 2024.01.08 쏘카 DevOps Engineer 면접 후기 (1) 2024.01.07