SQL interview questions for a Data Engineer

The document outlines SQL interview questions specifically designed for Data Engineers with 3-5 years of experience. It includes various SQL queries related to sales data, employee salaries, duplicate records, and data normalization versus denormalization. Additionally, it explains the differences between clustered and non-clustered indexes and their impact on query performance.

Uploaded by

Deepak Sarswa

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

38 views

SQL interview questions for a Data Engineer

Uploaded by

Deepak Sarswa

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 11

🔥🔥🔥Tech Mahindra🔥🔥🔥

🔥🔥🔥SQL interview questions for a Data Engineer

(3-5 years of experience.)🔥🔥🔥
--====================
--?? 25/02/2025
--====================
--PROBLEM STATEMENT :--TOP 10 SQL
--1. SQL INTERVIEW QUESTIONS FOR A
DATA ENGINEER (3-5 YEARS OF
EXPERIENCE.)
DROP TABLE ##CITY
CREATE TABLE ##CITY(SALE_ID INT, CITY
VARCHAR (50),SALE_DATE DATE, AMOUNT
INT)
GO
INSERT INTO ##CITY(SALE_ID,
CITY,SALE_DATE, AMOUNT )VALUES
(1,'MUMBAI','2024-01-10','5000'),
(2,'DELHI','2024-01-15','7000'),
(3,'BANGALORE','2024-01-20','10000'),
(4,'CHENNAI','2024-02-05','3000'),
(5,'MUMBAI','2024-02-08','9000'),
(6,'DELHI','2024-01-18','2000'),
(7,'CHENNAI','2024-02-09','3000'),
(8,'NOIDA','2024-02-18','9000')
SELECT * FROM ##CITY

WITH MONTHLYSALES AS (
SELECT
FORMAT(SALE_DATE, 'YYYY-MM')
AS SALE_MONTH,
CITY,
SUM(AMOUNT) AS TOTAL_SALES
FROM ##CITY
GROUP BY FORMAT(SALE_DATE, 'YYYY-
MM'), CITY
),
RANKEDSALES AS (
SELECT
SALE_MONTH,
CITY,
TOTAL_SALES,
RANK() OVER (PARTITION BY
SALE_MONTH ORDER BY TOTAL_SALES DESC)
AS RNK
FROM MONTHLYSALES
)
SELECT SALE_MONTH, CITY, TOTAL_SALES
FROM RANKEDSALES
WHERE RNK <= 3
ORDER BY SALE_MONTH, RNK;
--2.WRITE AN SQL QUERY TO CALCULATE
THE RUNNING TOTAL OF SALES FOR EACH
CITY. (SALES_DATA):
DROP TABLE ##CITY
CREATE TABLE ##CITY(SALE_ID INT, CITY
VARCHAR (50),SALE_DATE DATE, AMOUNT
INT)
GO
INSERT INTO ##CITY(SALE_ID,
CITY,SALE_DATE, AMOUNT )VALUES
(1,'MUMBAI','2024-01-10','5000'),
(2,'DELHI ','2024-01-15','7000'),
(3,'MUMBAI','2024-01-20','3000'),
(4,'DELHI ','2024-02-05','6000'),
(5,'MUMBAI','2024-02-08','8000')

SELECT CITY,SUM(AMOUNT) OVER

(PARTITION BY CITY ORDER BY
SALE_DATE)RUNNINGSALE FROM ##CITY
-- 3. FIND THE SECOND HIGHEST SALARY
OF EMPLOYEES. (EMPLOYEES):
DROP TABLE ##EMPLOYEES
CREATE TABLE ##EMPLOYEES(EMP_ID
INT,EMP_NAME VARCHAR(50),SALARY INT,
DEPARTMENT VARCHAR(50))
GO
INSERT INTO
##EMPLOYEES(EMP_ID,EMP_NAME,SALARY,
DEPARTMENT) VALUES
(1,'RAVI ','70000','HR'),
(2,'PRIYA','90000','IT'),
(3,'KUNAL','85000','FINANCE'),
(4,'AISHA','60000','IT'),
(5,'RAHUL','95000','HR')

SELECT * FROM (
SELECT *, DENSE_RANK()OVER(ORDER BY
SALARY DESC)RNK FROM ##EMPLOYEES
)AA WHERE RNK=2

-- 4. FIND EMPLOYEES WHO HAVE THE SAME

SALARY AS SOMEONE IN THE SAME
DEPARTMENT. (EMPLOYEE_SALARY):
DROP TABLE ##EMPLOYEE_SALARY
CREATE TABLE ##EMPLOYEE_SALARY(EMP_ID
INT,EMP_NAME VARCHAR (50),SALARY INT,
DEPARTMENT VARCHAR (50))
GO
INSERT INTO
##EMPLOYEE_SALARY(EMP_ID,EMP_NAME,SALA
RY,DEPARTMENT) VALUES
(1,'NEHA','50000','HR'),
(2,'RAVI','70000','IT'),
(3,'AMAN','50000','HR'),
(4,'POOJA','90000','IT'),
(5,'KARAN','70000','IT')
SELECT * FROM ##EMPLOYEE_SALARY ORDER
BY DEPARTMENT,SALARY

WITH CTE AS(

SELECT
DEPARTMENT,SALARY,DENSE_RANK()OVER
(PARTITION BY DEPARTMENT ORDER BY
DEPARTMENT,SALARY)RNK
FROM ##EMPLOYEE_SALARY
)SELECT DISTINCT
EMP_ID,EMP_NAME,E.SALARY,E.DEPARTMENT
FROM CTE C JOIN ##EMPLOYEE_SALARY E ON
C.DEPARTMENT=E.DEPARTMENT AND
C.SALARY=E.SALARY
WHERE RNK=1 ORDER BY
E.SALARY,E.DEPARTMENT
--5. WRITE AN SQL QUERY TO FIND
DUPLICATE RECORDS IN A TABLE.
(USERS):
DROP TABLE ##USERS
GO
CREATE TABLE ##USERS(USERID
INT,USERNAME VARCHAR (50),EMAIL
VARCHAR (50))
GO
INSERT INTO
##USERS(USERID,USERNAME,EMAIL)VALUES
(1,'SAMEER','SAMEER@GMAIL.COM'),
(2,'ANJALI','ANJALI@GMAIL.COM'),
(3,'SAMEER','SAMEER@GMAIL.COM'),
(4,'ROHAN','ROHAN@GMAIL.COM'),
(5,'ROHAN','ROHAN@GMAIL.COM')

SELECT * FROM (
SELECT * , DENSE_RANK()OVER(PARTITION
BY USERNAME,EMAIL ORDER BY USERID)RNK
FROM ##USERS
) AA WHERE RNK>1
-- 6. WRITE AN SQL QUERY TO DELETE
DUPLICATE ROWS WHILE KEEPING ONLY ONE
UNIQUE RECORD. (SAME SAMPLE DATA AS
QUESTION 5)

SELECT * FROM (
SELECT * , DENSE_RANK()OVER(PARTITION
BY USERNAME,EMAIL ORDER BY USERID)RNK
FROM ##USERS
) AA WHERE RNK=1

--7. WRITE AN SQL QUERY TO PIVOT A

TABLE BY MONTHS. SAMPLE DATA
(SALES_DATA):
DROP TABLE ##PIVOT
CREATE TABLE ##PIVOT(SALE_ID INT,CITY
VARCHAR (20),SALE_DATE DATE, AMOUNT
INT)
GO
INSERT INTO ##PIVOT
(SALE_ID,CITY,SALE_DATE, AMOUNT)
VALUES
(1,'MUMBAI','2024-01-10','5000'),
(2,'DELHI ','2024-02-15','7000'),
(3,'MUMBAI','2024-01-20','3000'),
(4,'DELHI ','2024-03-05','6000'),
(5,'MUMBAI','2024-02-08','8000')

SELECT * FROM ##PIVOT

SELECT CITY, ISNULL(JAN,0)JAN,

ISNULL(FEB,0)FEB, ISNULL(MAR,0)MAR
FROM (
SELECT
CITY,FORMAT(SALE_DATE,'MMM')SALE_DATE,
AMOUNT FROM ##PIVOT
)AA PIVOT (SUM(AMOUNT) FOR SALE_DATE
IN([JAN],[FEB],[MAR])) AS PT

SELECT CITY,
ISNULL([1],0)[1],ISNULL([2],0)[2],ISNU
LL([3],0)[3]
,ISNULL([1],0)+ISNULL([2],0)+ISNULL([3
],0)[GTOTAL] FROM (
SELECT CITY,MONTH(SALE_DATE)SALE_DATE,
AMOUNT FROM ##PIVOT
)AA PIVOT (SUM(AMOUNT) FOR SALE_DATE
IN([1],[2],[3])) AS PT
--8. FIND CUSTOMERS WHO PLACED AT
LEAST 3 ORDERS IN THE LAST 6 MONTHS.
SAMPLE DATA (ORDERS):
DROP TABLE ##ORDERS
CREATE TABLE ##ORDERS(ORDER_ID INT,
CUSTOMER_ID INT, ORDER_DATE DATE,
AMOUNT INT)
GO
INSERT INTO ##ORDERS(ORDER_ID,
CUSTOMER_ID, ORDER_DATE,AMOUNT) VALUES
(1,'101','2024-10-10','1000'),
(2,'102','2024-11-15','2000'),
(3,'101','2024-12-20','1500'),
(4,'103','2025-01-05','2500'),
(5,'101','2025-02-08','3000')

SELECT * FROM (
SELECT * ,COUNT(1)OVER(ORDER BY
CUSTOMER_ID)RNK FROM ##ORDERS WHERE
ORDER_DATE<=DATEADD(MONTH,-
6,GETDATE())
) AA WHERE RNK=3
--9. NORMALIZATION VS. DENORMALIZATION
– WHAT ARE THEY, AND WHEN SHOULD EACH
BE USED IN A DATA PIPELINE?
FEATURE<--->NORMALIZATION (OLTP)<---
>DENORMALIZATION (OLAP)
GOAL<--->REDUCE REDUNDANCY, ENSURE
INTEGRITY<--->IMPROVE READ/QUERY
PERFORMANCE
JOINS<--->MORE JOINS (COMPLEX
QUERIES)<--->FEWER JOINS (FASTER
QUERIES)
STORAGE<--->LESS STORAGE REQUIRED<---
>MORE STORAGE DUE TO REDUNDANCY
USE CASE<--->TRANSACTIONAL SYSTEMS
(BANKING, E-COMMERCE)<--->ANALYTICAL
SYSTEMS (DATA WAREHOUSES, REPORTING)
UPDATE SPEED<--->FASTER UPDATES (LESS
REDUNDANT DATA)<--->SLOWER UPDATES
(MULTIPLE COPIES OF DATA)
QUERY PERFORMANCE<--->SLOWER (DUE TO
JOINS)<--->FASTER (PRE-AGGREGATED OR
REDUNDANT DATA)
--10. INDEXING IN SQL – EXPLAIN
CLUSTERED VS. NON-CLUSTERED INDEXES.
HOW DO THEY IMPACT QUERY PERFORMANCE?

CLUSTERED INDEX
DETERMINES THE PHYSICAL ORDER OFDATA
IN A TABLE. IT CHANGES THE WAY THE
DATA IS STOREDON DISK AND CAN BE
CREATED ON ONLY ONE COLUMN. ATABLE CAN
HAVE ONLY ONE CLUSTERED INDEX.

NON-CLUSTERED INDEX
DOES NOT AFFECT THE PHYSICALORDER OF
DATA IN A TABLE. IT IS STORED
SEPARATELY ANDCONTAINS A POINTER TO
THE ACTUAL DATA. A TABLE CANHAVE
MULTIPLE NON-CLUSTERED INDEXES.

Apache Cassandra Administrator Associate - Exam Practice Tests
From Everand
Apache Cassandra Administrator Associate - Exam Practice Tests
Cristian Scutaru
No ratings yet
CS-2500 ASTM Host Interface Specifications For Out of US: Sysmex Corporation
No ratings yet
CS-2500 ASTM Host Interface Specifications For Out of US: Sysmex Corporation
58 pages
Dynamics AX AIF Services
No ratings yet
Dynamics AX AIF Services
122 pages
Oracle Essbase 11 Development Cookbook
From Everand
Oracle Essbase 11 Development Cookbook
Jose R. Ruiz
No ratings yet
WS-BPEL 2.0 Beginner's Guide
From Everand
WS-BPEL 2.0 Beginner's Guide
Matjaz B. Juric
No ratings yet
Sql Plsql Oracle
From Everand
Sql Plsql Oracle
Andrew Igla
No ratings yet
HBase Administration Cookbook
From Everand
HBase Administration Cookbook
Yifeng Jiang
No ratings yet
Instant Pentaho Data Integration Kitchen
From Everand
Instant Pentaho Data Integration Kitchen
Sergio Ramazzina
No ratings yet
PostgreSQL 9 High Availability Cookbook
From Everand
PostgreSQL 9 High Availability Cookbook
Shaun M. Thomas
5/5 (2)
Beginning Microsoft SQL Server 2012 Programming
From Everand
Beginning Microsoft SQL Server 2012 Programming
Paul Atkinson
1/5 (1)
Learn Hive in 24 Hours
From Everand
Learn Hive in 24 Hours
Alex Nordeen
No ratings yet
SCRUM: Mastering Agile Project Management for Exceptional Results (2023 Guide for Beginners)
From Everand
SCRUM: Mastering Agile Project Management for Exceptional Results (2023 Guide for Beginners)
Whitney Soto
No ratings yet
Databricks Certified Associate Developer for Apache Spark Using Python: The ultimate guide to getting certified in Apache Spark using practical examples with Python
From Everand
Databricks Certified Associate Developer for Apache Spark Using Python: The ultimate guide to getting certified in Apache Spark using practical examples with Python
Saba Shah
No ratings yet
HDInsight Essentials - Second Edition
From Everand
HDInsight Essentials - Second Edition
Rajesh Nadipalli
No ratings yet
ORACLE 12C Complete Self-Assessment Guide
From Everand
ORACLE 12C Complete Self-Assessment Guide
Gerardus Blokdyk
No ratings yet
My Part-Time Study Notes on Mssql Server
From Everand
My Part-Time Study Notes on Mssql Server
Morris Sebenzile Mntoninzi
No ratings yet
(Excerpts From) Investigating Performance: Design and Outcomes With Xapi
From Everand
(Excerpts From) Investigating Performance: Design and Outcomes With Xapi
Janet Laane Effron
No ratings yet
Optimizing Hadoop for MapReduce
From Everand
Optimizing Hadoop for MapReduce
Khaled Tannir
No ratings yet
Professional Microsoft SQL Server 2014 Integration Services
From Everand
Professional Microsoft SQL Server 2014 Integration Services
Devin Knight
No ratings yet
IBM DB2 9.7 Advanced Application Developer Cookbook
From Everand
IBM DB2 9.7 Advanced Application Developer Cookbook
Mohankumar Saraswatipura
No ratings yet
Oracle SOA BPEL Process Manager 11gR1 A Hands-on Tutorial
From Everand
Oracle SOA BPEL Process Manager 11gR1 A Hands-on Tutorial
Ravi Saraswathi
5/5 (1)
Professional Hadoop Solutions
From Everand
Professional Hadoop Solutions
Boris Lublinsky
4/5 (2)
AppDynamics Third Edition
From Everand
AppDynamics Third Edition
Gerardus Blokdyk
No ratings yet
Programming Microsoft Dynamics® NAV 2013
From Everand
Programming Microsoft Dynamics® NAV 2013
David A. Studebaker
No ratings yet
Oracle Essbase 9 Implementation Guide
From Everand
Oracle Essbase 9 Implementation Guide
Joseph Sydney Gomez
No ratings yet
Learn Hbase in 24 Hours
From Everand
Learn Hbase in 24 Hours
Alex Nordeen
No ratings yet
DB2 Exam C2090-320 Practice Questions
From Everand
DB2 Exam C2090-320 Practice Questions
Robert Wingate
No ratings yet
Microsoft Dynamics NAV 7 Programming Cookbook
From Everand
Microsoft Dynamics NAV 7 Programming Cookbook
Rakesh Raul
No ratings yet
EY & Zepto Data Analyst Interview Questions
No ratings yet
EY & Zepto Data Analyst Interview Questions
24 pages
ade_1737191501
No ratings yet
ade_1737191501
29 pages
SQL Interview Questions
No ratings yet
SQL Interview Questions
5 pages
Assignment
No ratings yet
Assignment
4 pages
Amazon Data Analyst Interview Questions -1
No ratings yet
Amazon Data Analyst Interview Questions -1
22 pages
A Data Pipeline Should Address These Issues:: Topics To Study
No ratings yet
A Data Pipeline Should Address These Issues:: Topics To Study
10 pages
Blinkit & Zepto interview questions
No ratings yet
Blinkit & Zepto interview questions
21 pages
Practical 2 Analytical Queries
No ratings yet
Practical 2 Analytical Queries
5 pages
SQL (4)
No ratings yet
SQL (4)
12 pages
SQL Answers
No ratings yet
SQL Answers
7 pages
Analytic_Functions_1671834736
No ratings yet
Analytic_Functions_1671834736
15 pages
February SQL Questions Compiled
No ratings yet
February SQL Questions Compiled
174 pages
sql_interview
No ratings yet
sql_interview
68 pages
SQL INTERVIEW PREPARATION PART 4.2
No ratings yet
SQL INTERVIEW PREPARATION PART 4.2
3 pages
Newton School Free SQL Handbook
No ratings yet
Newton School Free SQL Handbook
108 pages
SQL Queries Interview Questions - Oracle Analytical Functions Part 1
No ratings yet
SQL Queries Interview Questions - Oracle Analytical Functions Part 1
10 pages
SQL Scenario Based Questions-1
No ratings yet
SQL Scenario Based Questions-1
25 pages
Leveling Up With Advanced SQL
No ratings yet
Leveling Up With Advanced SQL
13 pages
SQL Questions
No ratings yet
SQL Questions
4 pages
SQL Handbook
No ratings yet
SQL Handbook
7 pages
ADBMS
No ratings yet
ADBMS
111 pages
QUERIES FOR PRACTICE(simple)
No ratings yet
QUERIES FOR PRACTICE(simple)
9 pages
Lecture 11 DMS
No ratings yet
Lecture 11 DMS
15 pages
Analytical Functions Recap
No ratings yet
Analytical Functions Recap
3 pages
Gopi SQL Ibm
No ratings yet
Gopi SQL Ibm
6 pages
OLAP Functions Part 1
No ratings yet
OLAP Functions Part 1
41 pages
SQL Q&A in Meesho and Flipkart
No ratings yet
SQL Q&A in Meesho and Flipkart
21 pages
SQL Interview Q&A
No ratings yet
SQL Interview Q&A
9 pages
Window Functions: Ginger Grant
No ratings yet
Window Functions: Ginger Grant
31 pages
Window Functions Cheat Sheet Ledger
No ratings yet
Window Functions Cheat Sheet Ledger
1 page
SQL_1737456396
No ratings yet
SQL_1737456396
17 pages
SQL Interview Q&A
No ratings yet
SQL Interview Q&A
18 pages
SQL Class 4 PDF Notes
No ratings yet
SQL Class 4 PDF Notes
27 pages
Sql_Interview_Questions_Top_100
No ratings yet
Sql_Interview_Questions_Top_100
18 pages
DSA Interview Questions
No ratings yet
DSA Interview Questions
13 pages
Cs8493 - Operating Systems
No ratings yet
Cs8493 - Operating Systems
7 pages
Exchanging Data Over The Network Using Delphi
No ratings yet
Exchanging Data Over The Network Using Delphi
4 pages
24AA00/24LC00/24C00: 128-Bit I C Bus Serial EEPROM
No ratings yet
24AA00/24LC00/24C00: 128-Bit I C Bus Serial EEPROM
34 pages
Iksemel Programmers Manual
No ratings yet
Iksemel Programmers Manual
28 pages
Sample 2023-24
No ratings yet
Sample 2023-24
12 pages
HANA Threads CurrentThreads 2.00.040+
No ratings yet
HANA Threads CurrentThreads 2.00.040+
17 pages
Notice MODBUS Enetronic
100% (1)
Notice MODBUS Enetronic
18 pages
Spec Sheet Dell Emc Powerscale
No ratings yet
Spec Sheet Dell Emc Powerscale
15 pages
CSD4001_SOFTWARE-VULNERABILITY-TESTING_LTP_1.0_1_Software Vulnerability Testing
No ratings yet
CSD4001_SOFTWARE-VULNERABILITY-TESTING_LTP_1.0_1_Software Vulnerability Testing
2 pages
Sensebot Log
No ratings yet
Sensebot Log
4 pages
1
No ratings yet
1
36 pages
c02062384 MSL2024 User and Service Guide PDF
No ratings yet
c02062384 MSL2024 User and Service Guide PDF
240 pages
Netapp Certification Program: Reference Document List
No ratings yet
Netapp Certification Program: Reference Document List
21 pages
NovaScale T810
No ratings yet
NovaScale T810
2 pages
Step 3 B
No ratings yet
Step 3 B
2 pages
Chapter Four
No ratings yet
Chapter Four
47 pages
SQL Cheat Sheet: By: Ika Purnamasari
No ratings yet
SQL Cheat Sheet: By: Ika Purnamasari
2 pages
Active@ Boot Disk User Guide
No ratings yet
Active@ Boot Disk User Guide
81 pages
Python 3 - Files I - O - Tutorialspoint
No ratings yet
Python 3 - Files I - O - Tutorialspoint
11 pages
Scloader 2 A
No ratings yet
Scloader 2 A
4 pages
PelicanHPC Tutorial
No ratings yet
PelicanHPC Tutorial
27 pages
F5 Networks Configuring BIG-IP AFM: Advanced Firewall Manager
No ratings yet
F5 Networks Configuring BIG-IP AFM: Advanced Firewall Manager
5 pages
Docu87837 - Isilon InsightIQ 4.1.2 User Guide
No ratings yet
Docu87837 - Isilon InsightIQ 4.1.2 User Guide
78 pages
The Benefits and Drawbacks of HTTP Compression
No ratings yet
The Benefits and Drawbacks of HTTP Compression
19 pages
DBMS Micro-Project 1
No ratings yet
DBMS Micro-Project 1
15 pages
Cryptography and Network Security: UNIT-5
No ratings yet
Cryptography and Network Security: UNIT-5
12 pages
Oracle SQL Syllabus
50% (2)
Oracle SQL Syllabus
1 page