ওয়েব থেকে ডেটা অনুলিপি করতে একটি সরঞ্জাম হিসাবে এক্সেল ব্যবহার করুন


ওয়েব স্ক্র্যাপিং একটি স্বয়ংক্রিয় পদ্ধতি ব্যবহার করে কোনও ওয়েবসাইট থেকে ডেটা, তথ্য বা ছবি তোলার কাজ। এটিকে অনুলিপি হিসাবে ভাবেন এবং সম্পূর্ণ স্বয়ংক্রিয়ভাবে পেস্ট করুন।

হয় আমরা যে ওয়েবসাইটগুলিতে চাই সেগুলিতে যেতে অ্যাপ্লিকেশনটি লিখি বা ব্যবহার করি এবং সেই ওয়েবসাইটগুলি থেকে আমরা নির্দিষ্ট জিনিসগুলির একটি অনুলিপি তৈরি করি। এটি একটি সম্পূর্ণ ওয়েবসাইট ডাউনলোড করা.

যে কোনও সরঞ্জামের মতো, ওয়েব স্ক্র্যাপিং ভাল বা খারাপের জন্য ব্যবহার করা যেতে পারে websites ওয়েবসাইটগুলি স্ক্র্যাপ করার আরও ভাল কারণগুলির মধ্যে কিছু এটি এশার্ক ইঞ্জিনে র‌্যাঙ্কিং করবে would এর সামগ্রী, দামের তুলনা শপিং বা মনিটরিস্টক বাজারের তথ্যের উপর ভিত্তি করে। আপনি এটিকে বাছাইয়ের গবেষণার সরঞ্জাম হিসাবেও ব্যবহার করতে পারেন

<চিত্র শ্রেণি = "অলস অ্যালিজেন্স্টার">

আমি কীভাবে এক্সেল দিয়ে ওয়েবসাইটগুলি স্ক্র্যাপ করতে পারি?

বিশ্বাস করুন বা না করুন, এক্সেল কমপক্ষে এক্সেল ২০০৩ সাল থেকে দীর্ঘকাল ধরে ডেটাফ্রোম্যাক্ট করার ক্ষমতা পেয়েছে It's এটি কেবলমাত্র ওয়েবস্ক্রেপিং এমন একটি জিনিস যা বেশিরভাগ লোকেরা ভাবেন না, কাজটি করার জন্য এস্প্রেডশিট প্রোগ্রামটি ব্যবহার করার বিষয়টি একা ভাবুন। তবে এটি আশ্চর্যজনকভাবে সহজ এবং শক্তিশালী Microsoft মাইক্রোসফ্ট অফিস কীবোর্ড শর্টকাটসের সংগ্রহ তৈরি করে এটি কীভাবে হয় তা শিখুন

আপনি যে সাইটগুলি স্ক্র্যাপ করতে চান তা সন্ধান করুন

আমরা প্রথমে যাচ্ছি করণ হল সেই নির্দিষ্ট ওয়েব পৃষ্ঠাগুলি সন্ধান করা যা থেকে আমরা তথ্য পেতে চাই। আসুন উত্সটিতে গিয়ে https://support.office.com/ অনুসন্ধান করুন। আমরা অনুসন্ধানের শব্দটি "প্রায়শই ব্যবহৃত শর্টকাটগুলি" ব্যবহার করতে যাচ্ছি। আউটলুক, এক্সেল, ওয়ার্ড ইত্যাদির মতো নির্দিষ্ট অ্যাপের নাম ব্যবহার করে আমরা এটিকে আরও নির্দিষ্ট করে তুলতে পারি। ফলাফল পৃষ্ঠাগুলি বুকমার্ক করা ভাল ধারণা হতে পারে তাই আমরা সহজেই সেখানে ফিরে আসতে পারি<ডি ক্লাস = "অলস WP-block-image"><চিত্র শ্রেণি = "অলস অ্যালিজেন্স্টার">

অনুসন্ধান ফলাফলটিতে ক্লিক করুন, "উইন্ডোজের জন্য এক্সেলের কিবোর্ড শর্টকাট"। এই পৃষ্ঠায় একবার, এক্সেল সংস্করণগুলির তালিকাটি সন্ধান করুন এবং আরও নতুন সংস্করণএ ক্লিক করুন। এখন আমরা সর্বশেষ এবং সর্বোত্তম সহকারে কাজ করছি।

আমরা আমাদের অনুসন্ধানের ফলাফলের পৃষ্ঠায় ফিরে যেতে এবং অন্যান্য ট্যাবস অ্যাপ্লিকেশনগুলির নিজস্ব ট্যাবগুলিতে খোলা এবং সেগুলি বুকমার্ক করতে পারি। এমনকি এই অনুশীলনের জন্য এটি ভাল ধারণা। এখানেই বেশিরভাগ লোকেরা অফিস শর্টকাটগুলি অন্তর্ভুক্ত করা বন্ধ করবে, তবে আমাদের নয়। আমরা এগুলিকে এক্সেলে রেখে যাচ্ছি তাই আমরা যখনই চাই উইকান তাদের সাথে যা খুশি তা করতে পারি

এক্সেল ও স্ক্র্যাপ খুলুন

এক্সেল ওপেন করুন এবং একটি নতুন ওয়ার্কবুক শুরু করুন। কার্যপত্রিকাটি অফিস শর্টকাটহিসাবে সংরক্ষণ করুন। আপনার যদি ওয়ানড্রাইভ থাকে তবে এটি সংরক্ষণ করুন যাতে অটোস্যাভফিচারউইল কাজ করে p

ওয়ার্কবুকটি সেভ হয়ে গেলে, ডেটাট্যাবে ক্লিক করুন <

<ডি ক্লাস = "অলস wp-block-image"><চিত্র শ্রেণি = "অলস অ্যালিজেন্সেন্টার">

ডেটা ট্যাবের ফিতাটিতে, ওয়েব থেকেএ ক্লিক করুন<ডি ক্লাস = "অলস WP-block-image"><চিত্র শ্রেণি = "অলস অ্যালিজেন্স্টার">

ওয়েব থেকেউইজার্ড উইন্ডো খুলবে। আমরা এখানে ওয়েবসাইটের ওয়েব ঠিকানা বা ইউআরএল রেখেছি যা থেকে আমরা ডেটা স্ক্র্যাপ করতে চাই। আপনার ওয়েব ব্রাউজারে স্যুইচ করুন এবং URL টি অনুলিপি করুন।

<ডি ক্লাস = "অলস WP-block-image"><চিত্র শ্রেণি = "অলস অ্যালিজেন্সেন্টার">

ইউআরএলটিএ আটকান ইউআরএলথেকে ওয়েব উইজার্ডের ক্ষেত্র। আমরা এটি বেসিকবা উন্নতমোডে ব্যবহার করতে বেছে নিতে পারি। অ্যাডভান্সড মোড আমাদের ওয়েবসাইট থেকে ডেটা অ্যাক্সেস করার জন্য আরও অনেক বিকল্প দেয়। এই অনুশীলনের জন্য, আমাদের কেবল বেসিকমোড প্রয়োজন। ওকেএ ক্লিক করুন<ডি ক্লাস = "অলস WP-block-image"><চিত্র শ্রেণি = "অলস অ্যালিজেন্স্টার">

এক্সেল এখন ওয়েবসাইটে সংযোগ করার চেষ্টা করবে। এই কয়েক সেকেন্ড সময় লাগতে পারে. এটি যদি হয় তবে আমরা একটি অগ্রগতি উইন্ডোটি দেখতে পাব

<চিত্র শ্রেণি = "অলস অ্যালগেন্সেন্টার">

নেভিগেটরউইন্ডোটি খুলবে এবং আমরা বাম দিকে ওয়েবসাইট থেকে টেবিলের একটি তালিকা দেখতে পাব we যখনই আমরা একটি নির্বাচন করি, তখন আমরা একটি টেবিলের পূর্বরূপ দেখতে পাব ঠিক আছে। আসুন প্রায়শই ব্যবহৃত শর্টকাটটেবিলটি নির্বাচন করুন p / চিত্র>

আমাদের যদি টেবিলের প্রয়োজনের আশেপাশে নজর দেওয়া দরকার হয় তবে আসল ওয়েবসাইটটি দেখতে আমরা ওয়েবউইভট্যাবে ক্লিক করতে পারি। যখন আমরা এটি খুঁজে পাই, আমরা এটিতে ক্লিক করতে পারি এবং এটি নির্বাচন করা হবে imp

<চিত্র শ্রেণি = "অলস অ্যালিজেন্স্টার">>

এখন, আমরা এই উইন্ডোর নীচে লোডবোতামে ক্লিক করি। আমরা বেছে নিতে পারি এমন অন্যান্য বিকল্প রয়েছে যা আমাদের জটিল স্ক্র্যাপ করার সুযোগটি আরও জটিল এবং beyond তারা যে আছে তা কেবল যত্নবান হোন। এক্সেলের ওয়েব স্ক্র্যাপিং ক্ষমতাগুলি খুব শক্তিশালী

ওয়েব সারণিটি কয়েক সেকেন্ড পরে এক্সেলে লোড হবে e আমরা বামদিকে থাকা ডেটা দেখতে পাব, যেখানে নীচের ছবিতেনম্বরটি রয়েছে। ওয়েবসাইট থেকে ডেটা পাওয়ার জন্য নম্বরপ্রশ্নহাইলাইট করে। যখন আমাদের একটি কার্য পুস্তকে একাধিক জিজ্ঞাসা থাকে, আমরা এখানেই আমাদের ব্যবহারের প্রয়োজন তা বেছে নিই

<চিত্র শ্রেণি = "অলস অ্যালিজেন্স্টার">

লক্ষ্য করুন যে ডেটা স্প্রেডশিটে একটি এক্সেলটেবল হিসাবে আসে। এটি ইতিমধ্যে আমাদের জন্য ডেটা ফিল্টার বা বাছাই করতে সক্ষম হয়েছে

আমরা অন্য সমস্ত ওয়েব পৃষ্ঠাগুলির জন্য এই প্রক্রিয়াটির পুনরাবৃত্তি করতে পারি যা আমরা আউটলুক, ওয়ার্ড, অ্যাক্সেস, পাওয়ারপয়েন্ট, এবং অন্য কোনও অফিস অ্যাপ্লিকেশন

এক্স্রেলে স্ক্র্যাপড ডেটা বর্তমান রাখা

আপনার জন্য বোনাস হিসাবে, আমরা কীভাবে এক্সেলের মধ্যে আমাদের ক্র্যাকড ডেটা টাটকা রাখতে পারি তা শিখতে চলেছি। ডেটা স্ক্র্যাপিংয়ের জন্য কেবলমাত্র শক্তিশালী এক্সেল চিত্রিত করার দুর্দান্ত উপায় way এটির সাথেও আমরা এক্সেলটি করতে পারে এমন মোস্টব্যাসিক স্ক্র্যাপিং করছি

উদাহরণস্বরূপ, আসুন https://www.cnbc.com/stocks/ এর মতো স্টক তথ্য ওয়েব পৃষ্ঠা ব্যবহার করুন<বিভাগ শ্রেণি = "অলস wp-block-image"><চিত্র শ্রেণি = "অলস অ্যালিজেন্সেন্টার">

আমরা আগে যা করেছি তা অনুলিপি করুন এবং অনুলিপি করুন এবং আটকান ঠিকানা বার থেকে নতুন ইউআরএল। ?

<চিত্রশ্রেণী = "অলস WP-block-image">

আপনি নেভিগেটর উইন্ডোতে পাবেন এবং টেবিলগুলি উপলভ্য পাবেন। আসুন মেজর মার্কিন স্টক সূচকগুলি নির্বাচন করুন<ডি ক্লাস = "অলস ডাব্লুপি-ব্লক-চিত্র"><চিত্র শ্রেণি = "অলস অ্যালিজেন্সার">

একবার ডেটা স্ক্র্যাপ হয়ে গেলে আমরা নিম্নলিখিতগুলি স্প্রেডশিট দেখতে পাব<ডি ক্লাস = "অলস ডাব্লু-ব্লক-চিত্র"><চিত্র শ্রেণি = "অলস অ্যালিজেন্স্টার">

ডানদিকে, আমরা মেজর মার্কিন স্টক সূচকের জন্য কোয়েরিটি দেখতে পেয়েছি e নির্বাচন করুন যাতে এটি হাইলাইট হয়। নিশ্চিত করুন যে আমরা সারণী সরঞ্জামট্যাবে এবং নকশাঅঞ্চলে রয়েছি। তারপরে রিফ্রেশএর নীচে নীচের তীরটিতে ক্লিক করুন। তারপরে সংযোগের বৈশিষ্ট্যএ ক্লিক করুন<ডি ক্লাস = "অলস WP-block-image"><চিত্র শ্রেণি = "অলস অ্যালিজেন্সেন্টার">

ব্যবহারট্যাবটির নীচে ক্যোয়ারি প্রপার্টিউইন্ডোতে, আমরা পারি কীভাবে এই তথ্য সতেজ হয় তা নিয়ন্ত্রণ করুন। আমরা রিফ্রেশ করার জন্য, বা পরের বার ওয়ার্কবুকটি খুললে রিফ্রেশ করার জন্য, বা ব্যাকগ্রাউন্ডে টেরফ্রেশ করার জন্য বা এর কোনও সংমিশ্রণের জন্য একটি নির্দিষ্ট সময়সীমা সেট করতে পারি। একবার আমরা কী সজ্জা বেছে নিয়েছি, ততক্ষণ বন্ধ করতে এবং চালিয়ে যেতে <<<<<<<<<<<<চিত্র শ্রেণি = "অলস অ্যালিজেন্স্টার"><গুলি >20

এটাই! এখন আপনি স্টকের দাম, স্পোর্টস স্কোর বা অন্য কোনও ডেটা ট্র্যাক করতে পারেন যা এক্সেল স্প্রেডশিট থেকে ঘন ঘন পরিবর্তিত হয়। আপনি যদি এক্সেল সমীকরণ এবং ফাংশন দিয়ে ভাল থাকেন তবে আপনি ডেটা দিয়ে যা খুশি তাই করতে পারেন।

হয়ত স্টকের প্রবণতাগুলি সনাক্ত করার চেষ্টা করুন, কাজ করে কোনও কল্পনাপ্রসূত স্পোর্টস পুল চালনা করুন বা আবহাওয়ার উপর নজর রাখতে পারেন। কে জানে? আপনার কল্পনা এবং ইন্টারনেটে উপলব্ধ ডেটা কেবলমাত্র সীমাবদ্ধ।

Statistical Programming with R by Connor Harris

সম্পর্কিত পোস্ট:

কীভাবে মাইক্রোসফ্ট অফিস ডকুমেন্টস থেকে ব্যক্তিগত মেটাডেটা সম্পূর্ণরূপে মুছবেন এক্সেলের মধ্যে কীভাবে COUNTIFS, SUMIFS, AVERAGEIFS ব্যবহার করবেন আপনার প্রথম এক্সেল ম্যাক্রো কীভাবে রেকর্ড করবেন 12 দরকারী মাইক্রোসফ্ট ওয়ার্ড টিপস এবং কৌশল কিভাবে এক্সেল প্রথম এবং শেষ নাম পৃথক দ্রুত একটি শব্দ ডক যাও বিষয়বস্তু একটি সারণী যোগ করুন ফর্ম্যাটিং কপি এবং পেস্ট করার জন্য ওয়ার্ডের ফর্ম্যাট পেইন্টার ব্যবহার করুন

22.06.2019