Answer:
Data pre-processing is the initial and important step in working with data. It involves cleaning and organizing data for analysis.
ڈیٹا پری پروسیسنگ ڈیٹا کے ساتھ کام کرنے میں پہلا اور اہم قدم ہے۔ اس میں تجزیہ کے لیے ڈیٹا کو صاف کرنا اور منظم کرنا شامل ہے۔
Answer:
Data science is the branch of knowledge in which computer programming skills along with mathematics and statistics are used to extract meaningful information from a collection of data.
ڈیٹا سائنس علم کی وہ شاخ ہے جس میں کمپیوٹر پروگرامنگ اسکلز کے ساتھ ساتھ میتھمیٹکس اور اسٹیٹسٹکس کو استعمال کیا جاتا ہے تاکہ ڈیٹا کے مجموعے سے بامعنی معلومات حاصل کی جا سکیں۔
Answer:
Data visualization is the graphical representation of data to get meaningful insights, trends, and patterns from data. The visual elements which help in data visualization are charts, graphs, maps, figures, and dashboards.
ڈیٹا ویژولائزیشن ڈیٹا کی گرافیکل نمائندگی ہے تاکہ ڈیٹا سے بامعنی بصیرت، رجحانات اور نمونے حاصل کیے جا سکیں۔ وہ بصری عناصر جو ڈیٹا ویژولائزیشن میں مدد کرتے ہیں وہ چارٹس، گراف، نقشے، اعداد و شمار اور ڈیش بورڈز ہیں۔
Answer:
Data Science plays a crucial role in determining the placement of various products in various shelves of the supermarket. Data science involves gathering, analyzing, and interpreting large amounts of data to find patterns and useful information.
ڈیٹا سائنس سپر مارکیٹ کے مختلف شیلفوں میں مختلف مصنوعات کی جگہ کا تعین کرنے میں اہم کردار ادا کرتی ہے۔ ڈیٹا سائنس میں پیٹرن اور مفید معلومات تلاش کرنے کے لیے بڑی مقدار میں ڈیٹا کو جمع کرنا، تجزیہ کرنا اور تشریح کرنا شامل ہے۔
Answer:
E-commerce, short for electronic commerce, refers to the buying and selling of goods and services over the internet. It encompasses a wide range of online transactions, including retail sales, business-to-business (B2B) transactions, online auctions, and digital downloads of products like software, music, and books.
ای-کامرس، جو الیکٹرانک کامرس کا مخفف ہے، انٹرنیٹ پر اشیاء اور خدمات کی خرید و فروخت کا حوالہ دیتا ہے۔ اس میں آن لائن لین دین کی ایک وسیع رینج شامل ہے، بشمول ریٹیل سیلز، بزنس ٹو بزنس (B2B) لین دین، آن لائن نیلامی، اور سافٹ ویئر، موسیقی اور کتابوں جیسی مصنوعات کی ڈیجیٹل ڈاؤن لوڈز۔
Answer:
Continuous data consists of values that can take any number within a given range, including fractions or decimals. Examples include student heights (150.5 cm, 160.2 cm), fruit weights (1.5 kg, 2.2 kg), and room temperatures (22.5°C, 23.7°C). It is considered continuous because it can be measured and can take on any value within a range.
تسلسل ڈیٹا میں وہ اقدار شامل ہوتی ہیں جو کسی دی گئی حد کے اندر کوئی بھی نمبر لے سکتی ہیں، بشمول جزوی یا اعشاریہ۔ مثالوں میں طلباء کی اونچائی (150.5 سینٹی میٹر، 160.2 سینٹی میٹر)، پھلوں کا وزن (1.5 کلوگرام، 2.2 کلوگرام)، اور کمرے کا درجہ حرارت (22.5°C، 23.7°C) شامل ہیں۔ اسے تسلسل سمجھا جاتا ہے کیونکہ اسے ناپا جا سکتا ہے اور یہ کسی حد کے اندر کوئی بھی قدر لے سکتا ہے۔
Answer:
Questionnaires are similar to surveys but are often written forms that people fill out. They usually have a set of questions that need to be answered. Surveys or questionnaires would be appropriate for collecting opinions from a large group about a new school policy.
سوالنامے سروے کی طرح ہوتے ہیں لیکن اکثر تحریری فارم ہوتے ہیں جنہیں لوگ بھرتے ہیں۔ ان کے پاس عام طور پر سوالات کا ایک مجموعہ ہوتا ہے جن کے جواب دینے کی ضرورت ہوتی ہے۔ سروے یا سوالنامے اسکول کی نئی پالیسی کے بارے میں ایک بڑے گروپ سے رائے جمع کرنے کے لیے موزوں ہوں گے۔
Answer:
Proper organization saves time. Think about searching for a book in a messy room versus a neatly arranged bookshelf. Similarly, when data is organized, it's easier to find and analyze. Organization helps identify patterns, trends, and relationships in the data more efficiently.
مناسب تنظیم وقت بچاتی ہے۔ ایک بے ترتیب کمرے میں کتاب تلاش کرنے کے بارے میں سوچیں بمقابلہ ایک خوب ترتیب شدہ بک شیلف۔ اسی طرح، جب ڈیٹا منظم ہوتا ہے، تو اسے تلاش کرنا اور تجزیہ کرنا آسان ہو جاتا ہے۔ تنظیم ڈیٹا میں پیٹرنز، رجحانات اور تعلقات کو زیادہ مؤثر طریقے سے شناخت کرنے میں مدد کرتی ہے۔
Answer:
Google Forms is a free tool from Google that helps you create surveys and collect responses online. Advantages include easy distribution, automatic data collection and organization, real-time response tracking, and accessibility from any device with internet connection.
گوگل فارمز گوگل کا ایک مفت ٹول ہے جو آپ کو سروے بنانے اور آن لائن جوابات جمع کرنے میں مدد کرتا ہے۔ فوائد میں آسان تقسیم، خودکار ڈیٹا جمع کرنا اور ترتیب دینا، حقیقی وقت میں جوابات کی ٹریکنگ، اور انٹرنیٹ کنکشن والے کسی بھی ڈیوائس سے رسائی شامل ہیں۔
Answer:
Data integration involves combining information from different sources to get a complete perspective. It helps in: 1. Organizing Data: Put all your saved information into one place, such as a document or spreadsheet. 2. Compare and Merge: Review data from different sources and find common themes. Integration provides a more comprehensive view of the subject being studied.
ڈیٹا انٹیگریشن کا مطلب ہے کہ مکمل نقطہ نظر حاصل کرنے کے لیے مختلف ذرائع سے معلومات کو یکجا کرنا۔ یہ مدد کرتا ہے: 1. ڈیٹا کو منظم کرنا: اپنی محفوظ کردہ تمام معلومات کو ایک جگہ پر رکھیں، جیسے کہ دستاویز یا اسپریڈ شیٹ۔ 2. موازنہ اور ضم کرنا: مختلف ذرائع سے ڈیٹا کا جائزہ لیں اور مشترکہ تھیم تلاش کریں۔ انضمام زیر مطالعہ مضمون کا زیادہ جامع نظریہ فراہم کرتا ہے۔
Answer:
When a school organizes social activities and wishes to track the number of students who attend each one, discrete data would be more relevant than continuous data, as it deals with countable whole numbers of participants.
جب کوئی اسکول سماجی سرگرمیاں منظم کرتا ہے اور ان میں سے ہر ایک میں شرکت کرنے والے طلباء کی تعداد کو ٹریک کرنا چاہتا ہے، تو گنتی کا ڈیٹا (discrete data) مسلسل ڈیٹا (continuous data) سے زیادہ متعلقہ ہوگا، کیونکہ یہ شرکاء کے قابل شمار مکمل اعداد سے متعلق ہے۔
Answer:
Data visualization is important because it makes understanding data much easier. Imagine trying to understand a list of hundreds of numbers. It's tough, right? But when those numbers are displayed as a bar chart, it's much easier to see what's going on. Visualization helps identify patterns, trends, and outliers in complex data that might be difficult to detect in raw numerical form.
ڈیٹا ویژولائزیشن اس لیے اہم ہے کیونکہ یہ ڈیٹا کو سمجھنا بہت آسان بناتا ہے۔ تصور کریں کہ سینکڑوں اعداد کی فہرست کو سمجھنے کی کوشش کر رہے ہیں۔ یہ مشکل ہے، ہے نا؟ لیکن جب ان اعداد کو بار چارٹ کے طور پر دکھایا جاتا ہے، تو یہ دیکھنا بہت آسان ہو جاتا ہے کہ کیا ہو رہا ہے۔ ویژولائزیشن پیچیدہ ڈیٹا میں پیٹرنز، رجحانات اور آؤٹ لائرز کی شناخت میں مدد کرتا ہے جنہیں عددی شکل میں پتہ لگانا مشکل ہو سکتا ہے۔
Answer:
Line graphs, often known as line charts or line plots, are data visualization tools. They are a type of graph that depicts data in graphical format, making the raw data more intelligible. Line graphs are particularly useful for showing trends over time. Example: A chart displaying the number of students in a class that attend school every day for a week, showing attendance patterns over time.
لائن گراف، جنہیں اکثر لائن چارٹس یا لائن پلاٹس بھی کہا جاتا ہے، ڈیٹا ویژولائزیشن کے اوزار ہیں۔ یہ ایک قسم کے گراف ہیں جو ڈیٹا کو گرافیکل فارمیٹ میں دکھاتے ہیں، جس سے خام ڈیٹا زیادہ سمجھ میں آ جاتا ہے۔ لائن گراف خاص طور پر وقت کے ساتھ رجحانات (trends) کو دکھانے کے لیے مفید ہیں۔ مثال: ایک چارٹ جو ایک ہفتے کے دوران روزانہ سکول آنے والے طلباء کی تعداد کو ظاہر کرتا ہے، جو وقت کے ساتھ ساتھ حاضری کے پیٹرن (patterns) کو دکھاتا ہے۔
Answer:
Qualitative data refers to categories or labels that describe qualities or characteristics rather than quantities. Nominal data is used to label or categorize items without implying any order.
Qualitative data سے مراد ایسی کیٹیگریز یا لیبلز ہیں جو مقدار کے بجائے خصوصیات یا صفات کو بیان کرتی ہیں۔ Nominal data کا استعمال آئٹمز کو لیبل کرنے یا درجہ بندی کرنے کے لیے کیا جاتا ہے، بغیر کسی ترتیب کے۔
Answer:
Structured Data is organized and formatted for easy searching and analysis; examples include data in spreadsheets and traditional databases. Unstructured Data is more free-form and doesn't fit into a specific format.
سٹرکچرڈیٹا منظم اور تلاش اور تجزیہ میں آسانی کے لیے فارمیٹ کیا جاتا ہے۔ اس کی مثالیں اسپریڈشیٹس اور روایتی ڈیٹا بیس میں موجود ڈیٹا ہیں۔ انسٹرکچر ڈیٹا زیادہ فری فارم ہوتا ہے اور مخصوص فارمیٹ میں فٹ نہیں ہوتا۔
Answer:
A spreadsheet is a digital application or software tool that organizes, analyzes, and stores data in tabular format. It is composed of a grid of rows and columns, with each intersection forming a cell.
اسپریڈ شیٹ ایک ڈیجیٹل ایپلی کیشن یا سافٹ ویئر ٹول ہے جو ڈیٹا کو ٹیبلر فارمیٹ میں منظم، تجزیہ اور محفوظ کرتا ہے۔ یہ قطاروں اور کالموں کے ایک گرڈ پر مشتمل ہوتا ہے، جس میں ہر چوراہے پر ایک سیل بنتا ہے۔
Answer:
A backup is a copy of important data or files stored separately from the original, used to protect against data loss.
بیک اپ ایک اہم ڈیٹا یا فائلوں کی کاپی ہوتی ہے جو اصل سے الگ محفوظ کی جاتی ہے، تاکہ ڈیٹا کے ضائع ہونے سے بچایا جا سکے۔
Answer:
Ordinal data represents categories with a meaningful order, though the differences between categories are not uniform.
آرڈینل ڈیٹا ایسے زمرے ظاہر کرتا ہے جن میں ایک بامعنی ترتیب ہوتی ہے، حالانکہ زمروں کے درمیان فرق یکساں نہیں ہوتا۔
Answer:
These include websites, databases, and digital tools where you can find and collect information. For example, if you're researching the most popular pets, you might use the internet to find statistics or articles about pet ownership.
ان میں ویب سائٹس، ڈیٹا بیسز، اور ڈیجیٹل ٹولز شامل ہیں جہاں سے آپ معلومات حاصل اور جمع کر سکتے ہیں۔ مثال کے طور پر، اگر آپ سب سے مقبول پالتو جانوروں پر تحقیق کر رہے ہیں، تو آپ پالتو جانوروں کی ملکیت کے بارے میں اعدادوشمار یا مضامین تلاش کرنے کے لیے انٹرنیٹ کا استعمال کر سکتے ہیں۔
Answer:
It is a method of collecting information from individuals. The basic purpose of a survey is to collect data to describe different characteristics such as usefulness, quality, price, kindness, etc.
یہ افراد سے معلومات اکٹھا کرنے کا ایک طریقہ ہے۔ سروے کا بنیادی مقصد مختلف خصوصیات جیسے کہ افادیت، معیار، قیمت، مہربانی وغیرہ بیان کرنے کے لیے ڈیٹا اکٹھا کرنا ہے۔
Answer:
Primary Data Collection: Involves the collection of original data directly from the data source or via direct interaction with the respondent. Secondary Data Collection: Involves data collection using existing data collected by someone else for some purpose. Such data is usually available in the form of published material like research papers, books, websites, etc.
پرائمری ڈیٹا اکٹھا کرنا: اس میں ڈیٹا کے ماخذ سے براہ راست یا جواب دہندہ کے ساتھ براہ راست رابطے کے ذریعے اصل ڈیٹا اکٹھا کرنا شامل ہے۔ سیکنڈری ڈیٹا اکٹھا کرنا: اس میں کسی اور کے ذریعہ کسی مقصد کے لیے پہلے سے جمع کیے گئے ڈیٹا کو استعمال کرتے ہوئے ڈیٹا اکٹھا کرنا شامل ہے۔ یہ ڈیٹا عام طور پر شائع شدہ مواد کی شکل میں دستیاب ہوتا ہے جیسے تحقیقی مقالے، کتابیں، ویب سائٹس وغیرہ۔
Answer:
Data collection is the systematic process of gathering, documenting, and organizing data from a variety of sources to extract significant insights, facilitate informed decision-making, or allow for rigorous analysis.
ڈیٹا کلیکشن (Data collection) مختلف ذرائع سے ڈیٹا کو اکٹھا کرنے، دستاویز کرنے اور منظم کرنے کا ایک منظم عمل ہے تاکہ اہم بصیرت حاصل کی جا سکے، باخبر فیصلہ سازی کی سہولت فراہم کی جا سکے، یا سخت تجزیے کی اجازت دی جا سکے۔
Answer:
Summary statistics provide information about the data in a sample. It can help understand the values better. It may include the total number of values, minimum value, maximum value, along with the mean value and the standard deviation corresponding to a data collection.
سمرّی اسٹیٹسٹکس نمونے میں موجود ڈیٹا کے بارے میں معلومات فراہم کرتے ہیں۔ یہ ویلیوز کو بہتر طور پر سمجھنے میں مدد کر سکتے ہیں۔ اس میں ویلیوز کی کل تعداد، کم سے کم ویلیو، زیادہ سے زیادہ ویلیو، کے ساتھ ساتھ ڈیٹا کی کلیکشن کے مطابق مین ویلیو اور اسٹینڈرڈ ڈیویشن شامل ہو سکتے ہیں۔
Answer:
Statistics is the analysis of the frequency of past events and probability is to predict the likelihood of future events. Statistics is used in various fields such as science, business, economic, social sciences, and more, to understand patterns, trends, and relationships within data.
اسٹیٹسٹکس (Statistics) گزشتہ واقعات کی فریکوئنسی (frequency) کا تجزیہ ہے اور پروببلٹی (Probability) مستقبل کے واقعات کے امکان کی پیشین گوئی کرنا ہے۔ اسٹیٹسٹکس کو مختلف شعبوں میں استعمال کیا جاتا ہے جیسے سائنس، بزنس (business)، اکنامک (economic)، سوشل سائنسز (social sciences)، اور مزید، تاکہ ڈیٹا (data) کے اندر موجود پیٹرنز (patterns)، ٹرینڈز (trends)، اور تعلقات کو سمجھا جا سکے۔
Answer:
The range is the simplest measure of spread. It is the difference between the highest and lowest values. For example, for the test scores 60, 75, 83, 91, and 95, the range is 95-60=35.
رینج پھیلاؤ کا سب سے آسان پیمانہ ہے۔ یہ سب سے بڑی اور سب سے چھوٹی قدر کے درمیان کا فرق ہے۔ مثال کے طور پر، ٹیسٹ کے اسکور 60، 75، 83، 91، اور 95 کے لیے، رینج 95-60=35 ہے۔
Answer:
Variance measures how spread out the values are from the mean. It gives a sense of how much the values in a dataset vary from the mean.
ویرنس پیمانہ ہے کہ اقدار اوسط سے کتنی پھیلی ہوئی ہیں۔ یہ اس بات کا اندازہ دیتا ہے کہ ڈیٹا سیٹ میں اقدار اوسط سے کتنی مختلف ہیں۔
Answer:
A computer system is a fundamental and important part of modern life. It has revolutionized the way we work, communicate, learn, and entertain ourselves. In today's world, we are surrounded by a lot of data, which may be on our computer system or otherwise.
ایک کمپیوٹر سسٹم جدید زندگی کا ایک بنیادی اور اہم حصہ ہے۔ اس نے ہمارے کام کرنے، بات چیت کرنے، سیکھنے اور تفریح کے طریقے میں انقلاب برپا کر دیا ہے۔ آج کی دنیا میں، ہم بہت سارے ڈیٹا سے گھرے ہوئے ہیں، جو ہمارے کمپیوٹر سسٹم پر یا بصورت دیگر ہو سکتا ہے۔
Answer:
The number of students in your class is quantitative (numerical) data, specifically discrete data, because it represents a countable quantity.
آپ کی کلاس میں طلباء کی تعداد کوانٹیٹیٹیو (عددی) ڈیٹا ہے، خاص طور پر ڈسکریٹ ڈیٹا، کیونکہ یہ گنتی کی مقدار کو ظاہر کرتا ہے۔
Answer:
NoSQL stands for 'Not Only SQL' and refers to a variety of database technologies designed to handle different types of data that may not fit well into traditional databases.
NoSQL کا مطلب ہے 'Not Only SQL' اور یہ مختلف قسم کی ڈیٹا بیس ٹیکنالوجیز کا حوالہ دیتا ہے جو مختلف قسم کے ڈیٹا کو سنبھالنے کے لیے ڈیزائن کی گئی ہیں جو روایتی ڈیٹا بیس میں اچھی طرح سے فٹ نہیں ہو سکتی ہیں۔
Answer:
Big data plays a significant role in the Internet of Things (IoT) ecosystem by enabling the collection, storage, processing and analysis of massive volumes of data generated by IoT devices. IoT devices generate continuous data.
بگ ڈیٹا انٹرنیٹ آف تھنگز (IoT) ایکو سسٹم میں ایک اہم کردار ادا کرتا ہے، جو IoT آلات سے پیدا ہونے والے وسیع حجم کے ڈیٹا کی جمع آوری، ذخیرہ اندوزی، پروسیسنگ اور تجزیہ کو قابل بناتا ہے۔ IoT آلات مسلسل ڈیٹا پیدا کرتے ہیں۔
Answer:
The three Vs of big data are: Volume: Refers to the amount of data. Big data deals with huge volumes of low-density, unstructured data. Velocity: Refers to the speed of data, which is the fast rate at which data is received. Variety: Refers to the various formats and types of data that are available. Traditional data types were structured and fit neatly in a relational database.
بگ ڈیٹا کے تین V یہ ہیں: والیوم (Volume): ڈیٹا کی مقدار کو ظاہر کرتا ہے۔ بگ ڈیٹا کم کثافت والے، غیر منظم ڈیٹا کے وسیع حجم سے نمٹتا ہے۔ ویلاسٹی (Velocity): ڈیٹا کی رفتار کو ظاہر کرتا ہے، جو وہ تیز رفتار ہے جس پر ڈیٹا موصول ہوتا ہے۔ ورائٹی (Variety): دستیاب ڈیٹا کی مختلف اقسام اور فارمیٹس کو ظاہر کرتا ہے۔ روایتی ڈیٹا کی اقسام منظم تھیں اور ریشنل ڈیٹا بیس میں آسانی سے فٹ ہوجاتی تھیں۔
Answer:
Predictive Maintenance: It is a maintenance strategy that uses the analysis of existing data to predict when equipment, machinery, or a product is likely to fail. Fraud and Compliance: Big data analytics can identify and detect unusual suspicious patterns and anomalies.
پیشن گوئی کی بحالی : یہ ایک دیکھ بھال کی حکمت عملی ہے جو موجودہ ڈیٹا کے تجزیے کا استعمال کرتی ہے تاکہ یہ پیش گوئی کی جا سکے کہ سامان، مشینری، یا کوئی پروڈکٹ کب ناکام ہونے کا امکان ہے۔ فراڈ اور تعمیل : بڑے ڈیٹا کے تجزیے غیر معمولی مشکوک نمونوں اور بے ضابطگیوں کی شناخت اور پتہ لگا سکتے ہیں۔
Answer:
Qualitative data refer to categories or labels used to describe the qualities or characteristics of something rather than its quantity. Quantitative data consists of numbers used to measure the quantity or amount of something. These data types answer questions like 'How much?' or 'How long?'.
کوالٹیٹیو ڈیٹا کا مطلب ایسی کیٹیگریز یا لیبلز ہیں جو کسی چیز کی خصوصیات یا خصلتوں کو بیان کرنے کے لیے استعمال ہوتے ہیں، نہ کہ اس کی مقدار کو۔ کوانٹیٹیو ڈیٹا میں ایسے نمبرز ہوتے ہیں جو کسی چیز کی مقدار یا پیمائش کو ظاہر کرتے ہیں۔ یہ ڈیٹا کی اقسام 'کتنا؟' یا 'کتنی دیر؟' جیسے سوالات کے جواب دیتی ہیں۔