জাভা থ্রেড প্রোগ্রামিংঃ ডেটা রেইস (Java Thread Programming: Data Race)

Posted on by

Categories:         

আমরা যখনি একাধিক থ্রেডের জন্য কোড লিখব তখনি আমাদের চিন্তা করতে হবে যে, এই কোডটি থ্রেড সেফ কি না। থ্রেইড সেইফের সহজ সংজ্ঞা আমরা জানি। এর অর্থ হলো, কোড সঠিকভাবে কাজ করবে। আমরা যখন একটি প্রোগ্রাম লিখি, সেই ক্লাসের একটি স্পেসিফিকেশন থাকে। আমরা সাধারণত প্রোগ্রাম লেখার সময় এর ফরমাল কোনো স্পেসিফিকেশন লিখি না, তবে এই ক্লাসের উদ্দেশ্য সম্পর্কে আমাদের ধারণা থাকে। প্রোগ্রামটিকে রান করা হলে এর ফলাফল সম্পর্কে আমাদের একটি পরিষ্কার ধারণা থাকে। এই প্রোগ্রামটি হয়তো একটি থ্রেড দিয়ে রান করলে যে ফলাফল দেয় সেই সম্পর্কে আমাদের আস্থা থাকে। একই প্রোগ্রামটি যদি একাধিক থ্রেডে রান করা হয়, তাহলে যদি আগের মতো একই রকম আস্থা আমাদের থাকে, তাহলে সেই প্রোগ্রামটিকে আমরা থ্রেড সেফ বলতে পারি। একটি প্রোগ্রামকে থ্রেড সেফ নিশ্চিত করতে হলে প্রোগ্রামটির ডেটাগুলো ঠিকমতো সময়ের সমন্বয় করতে হয় (Synchronize) করতে হয় (এখানে synchronized কিওয়ার্ডের কথা বলা হচ্ছে না)। একটি থ্রেড যে ডেটাগুলো পড়তে পারে বা পরিবর্তন করতে পারে, সেগুলোকে published ডেটা বলা হয়। ডেটা পাবলিশ করার সময় আমাদের সতর্কতা অবলম্বন করা জরুরি। আমরা জানি যে আধুনিক সিপিইউ ডেটা ক্যাশ ব্যবহার করে এবং আধুনিক কম্পিউটারে একাধিক সিপিইউ থাকে। কোনো একটি থ্রেড কোনো সিপিইউতে কোনো ডেটা পরিবর্তন করলে, অন্য সিপিইউতে যে থ্রেডটি চলতে তা সঙ্গে সঙ্গে নাও দেখতে পারে। তবে ভ্যালু যদি পরিবর্তন না হয়, সে ক্ষেত্রে দুশ্চিন্তার কোনো কারণ নেই। সে ক্ষেত্রে ইমমিউটেবল (immutable) ডেটা ব্যবহার করা যায়। আমরা যদি কোনো থ্রেডে ডেটা পরিবর্তন করি, তাহলে আমাদের নিশ্চিত হতে হবে যে, এই পরিবর্তন অন্য থ্রেড যদি এই ডেটা পড়ে তাহলে যেন সঠিক ডেটা (এ ক্ষেত্রে সর্বশেষ সংস্করণ) পড়তে পারে। কোনো কারণে যদি এর ব্যত্যয় ঘটে, তাহলে প্রোগ্রামটিতে ডেটা সিনক্রোনাইজেশনের সমস্যা রয়েছে এবং প্রোগ্রামটি থ্রেড সেফ নয়। একটি জাভা প্রোগ্রাম দেখা যাক-  

public class HiHello {
    static boolean s = false;

    public static void main(String\[\] args) {

        Thread t1 = new Thread(() -> {
            while (!s) {
            }
            System.out.println("Hello!");
        });
        t1.start();

        Thread t2 = new Thread(() -> {
            s = true;
            System.out.println("Hi");
        });
        t2.start();
    }

ওপরের প্রোগ্রামটিতে দুটি থ্রেড ব্যবহার করা হয়েছে। দুটি থ্রেড একটি ডেটা শেয়ার করে। এখানে লক্ষ করুন, প্রথম থ্রেডে একটি হুয়াইল লুপ তৈরি করা হয়েছে। এই লুপটি ততক্ষণ পর্যন্ত চলবে যতক্ষণ পর্যন্ত s-এর মান false থাকবে। এর পরের লাইনে একটি টেক্সট প্রিন্ট করতে দেওয়া। দ্বিতীয় থ্রেডের প্রথম লাইনে s-এর মান পরিবর্তন করে দ্বিতীয় লাইনে একটি টেক্সট প্রিন্ট করতে দেওয়া হয়েছে। এই থ্রেড দুটিকে রান করতে দিলে যদিও আপাতদৃষ্টিতে মনে হচ্ছে এর ফলাফল নিচের মতো হওয়া উচিত-

Hi
Hello!

কিন্তু এই প্রোগ্রামটিকে রান করলে কম্পিউটারভেদে একেক রকম ফলাফল হতে পারে। সিঙ্গেল থ্রেডেড প্রোগ্রামে এক্সিকিশন অর্ডার একটি হলেও মাল্টি থ্রেডেড এনভায়রনমেন্টে কোডের এক্সিকিশন অর্ডার বিভিন্ন রকম হয়। মাল্টি থ্রেডেড এনভায়রনমেন্টে প্রোগ্রামের এক্সিকিশন অর্ডার নির্ভর করে শিডিউলার, প্রসেসর এবং দুটি থ্রেডের মধ্যে ইন্টাঅ্যাকশনের ওপর। তাহলে ওপরের প্রোগ্রামের সম্ভাব্য আউটপুট হলো-

1. প্রথম থ্রেড হুয়াইল লুপটির মধ্যে আটকে থাকবে। দ্বিতীয় থ্রেডে s-এর মান পরিবর্তনের সঙ্গে সঙ্গে প্রথম থ্রেড হুয়াইল লুপ থ্রেকে বের হয়ে Hello! প্রিন্ট করবে। এরপর দ্বিতীয় থ্রেডে Hi প্রিন্ট হবে। এ ক্ষেত্রে আউটপুট হবে-

Hello!
Hi

2. প্রথম থ্রেডে লুপ চলতে থাকবে। দ্বিতীয় থ্রেড ভ্যালু পরিবর্তন করবে এবং পরের লাইনটি প্রিন্ট করবে । এরপর প্রথম থ্রেডের লুপ ব্রেক হবে, যেহেতু s-এর মান পরির্তন হয়েছে এবং পরের লাইন এক্সিকিউট করবে। এ ক্ষেত্রে আউটপুট হবে-

Hi
Hello!

3. আরেকটি আউটপুট হতে পারে, প্রথম থ্রেডটি হুয়াইল লুপে আটকে থাকবে এবং দ্বিতীয় থ্রেড s-এর মান পরিবর্তন করে পরের লাইন এক্সিকিউট করবে এবং Hi প্রিন্ট হবে। এটি সম্ভব হবে যদি, দুটি থ্রেড দুটি সিপিইউতে রান করে এবং দ্বিতীয় থ্রেডের পরিবর্তন প্রথম থ্রেড সঙ্গে সঙ্গে না পড়তে পারে। এ ক্ষেত্রে প্রথম থ্রেড হুয়াইল লুপে আটকা পড়ে থাকবে এবং দ্বিতীয় থ্রেড Hi প্রিন্ট করে বন্ধ হয়ে যাবে।

তাহলে আমার নিশ্চিত করেই বলতে পারছি যে, ওপরের প্রোগ্রামটি কোনোভাবেই থ্রেড সেফ নয়। ওপরের আলোচনা থেকে আমরা বুঝলাম যে একটি প্রোগ্রামের এক্সিকিউশন অর্ডার বিভিন্ন রকম হতে পারে এবং এটি নির্ভর করে সময়ের ওপর, কম্পাইলারের অপটিমাইজেশনের ওপর, জাভা ভার্চুয়াল মেশিন ও সিপিইউয়ের ওপর। এর ফলে প্রোগ্রামের আউটপুট কী হবে তা নির্দিষ্ট করে বলা যাচ্ছে না। মাল্টি থ্রেডেড এনভায়রনমেন্টে এরকম অবস্থায় যদি সঠিক আউটপুট না পাওয়া যায়, তখন এই ঘটনাকে বলা হয় ডেটা রেস (Data Race)। তাহলে দেখা যাচ্ছে যে, ডেটা সঠিকভাবে সিনক্রোনাইজেশন করার অভাবে ডেটা রেইস উৎপত্তি হচ্ছে। এই ডেটা রেসের একটি সহজ সমাধান হচ্ছে, এরকম শেয়ার্ড ভ্যারিয়েবলে volatile কিওয়ার্ড ব্যবহার করা। এই কিওয়ার্ড শুধু ফিল্ড ও স্ট্যাটিক ফিল্ডে ব্যবহার করা যায়। লোকাল ভ্যারিয়েবল যেহেতু শেয়ার করা যায় না, সুতরাং লোকাল ভ্যারিয়েবলে এই কিওয়ার্ড ব্যবহার করার কোনো কারণ নেই। অন্যদিকে ফাইনাল ভ্যারিয়েবলগুলো যেহেতু পরিবর্তন করা যায় না, সুতরাং এতেও এই কিওয়ার্ড ব্যবহার করার দরকার নেই। এখানে উল্লখ্য যে, যখন কোনো রেফারেন্স ভ্যারিয়েবল যেমন অবজেক্ট বা অ্যারে ভ্যারিয়েবলে যখন volatile কিওয়ার্ড ব্যবহার করা হয়, এর মানে রেফারেন্সটি ভলাটাইল, এই অবজেক্টের উপাদনগুলো নয়। এই কিওয়ার্ড ব্যবহারের ফলে কয়েকটি সুবিধা হয়- * থ্রেড সব সময় সর্বশেষ ডেটা পড়বে। এর ফলে প্রথম উদাহরণে সমস্যাটি হওয়ার সম্ভনা তৈরি হবে না। কারণ, দ্বিতীয় থ্রেডে S-এর মান পরিবর্তনের ফলাফল অবশ্যই প্রথম থ্রেড পড়বে। volatile ভ্যারিয়েবল সব সময় মেইন মেমোরিতে পরিবর্তন হয় এবং থ্রেড সব সময় মেইন মোমোরি থেকেই ডেটা পড়বে, ক্যাশ থেকে নয়। এটি বিভিন্ন থ্রেডে ডেটা ভিজিবিলিটি নিশ্চিত করে। * যেহেতু ভ্যারিয়েবলে volatile কিওয়ার্ড রয়েছে, এটি কম্পাইলারকে নির্দেশ করে যে, শেয়ার্ড ভ্যারিয়েবলের মান যেকোনো সময় পরবর্তন করার প্রয়োজন হতে পারে এবং তা ভিন্ন ভিন্ন থ্রেড থেকে হতে পারে। এর ফলে কম্পাইলার অপটিমাইজেশন থেকে বিরত থাকে। এ ছাড়া এটি ডেটা সিনক্রোনাইজেশনের একটি উপায়। কম্পাইলার প্রোগ্রাম কম্পাইল করার সময় এক ধরনের মেমোরি বেষ্টনীর (memory fence or barrier) ইনস্ট্রাকশন যুক্ত করে। এটি সিপিইউকে এক্সিকিউশন অর্ডারের পরিবর্তন থেকে বিরত রাখে। যদিও volatile কিওয়ার্ড যুক্ত করে ওপরের সমস্যাগুলো সমাধান করা গেল, তবে অতিরিক্ত ভলাটাইল ভ্যারিয়েবলের ব্যবহার প্রোগ্রামের পারফরম্যান্স কমিয়ে দিতে পারে। কারণ এ ক্ষেত্রে যেহেতু সিপিইউ ক্যাশ ব্যবহার করতে পারছে না, সুতরাং থ্রেডে কার্য সম্পাদনের গতি একটি কমে যেতে পারে। এ ছাড়া যেহেতু কম্পাইলার, জাভা ভার্চুয়াল মেশিন ও সিপিইউ এক্সিকিউশন অর্ডারের পরিবর্তন করতে পারে না, সুতরাং প্রোগ্রামটির অপটিমাইজেন করা সম্ভব হয় না। থ্রেড সেইফটি ও থ্রেড প্রোগ্রামিং সম্পর্কে আরও বিস্তারিত জানতে হলো [জাভা থ্রেড প্রোগ্রামিং][1] বইটি সংগ্রহ করুন। Link:  [1]: http://bit.ly/2Hej5bE

         

Share on:

Author: A N M Bazlur Rahman

Java Champion | Software Engineer | JUG Leader | Book Author | InfoQ & Foojay.IO Editor | Jakarta EE Ambassadors| Helping Java Developers to improve their coding & collaboration skills so that they can meet great people & collaborate

100daysofcode 100daysofjava access advance-java agile algorithm arraylist article bangla-book becoming-expert biginteger book calculator checked checked-exceptions cloning code-readability code-review coding coding-convention collection-framework compact-strings completablefuture concatenation concurrency concurrentmodificationexception concurrentskiplistmap counting countingcollections critical-section daemon-thread data-race data-structure datetime day002 deliberate-practice deserialization design-pattern developers duration execute-around executors export fibonacci file file-copy fork/join-common-pool functional future-java-developers groupby hash-function hashmap history history-of-java how-java-performs-better how-java-works http-client image import inspiration io itext-pdf java java-10 java-11 java-17 java-8 java-9 java-developers java-performance java-programming java-thread java-thread-programming java11 java16 java8 lambda-expression learning learning-and-development linkedlist list local-type-inference localdatetime map methodology microservices nio non-blockingio null-pointer-exception object-cloning optional packaging parallel pass-by-reference pass-by-value pdf performance prime-number programming project-loom race-condition readable-code record refactoring review scheduler scrum serialization serversocket simple-calculator socket software-development softwarearchitecture softwareengineering sorting source-code stack string string-pool stringbuilder swing thread threads tutorial unchecked vector virtual-thread volatile why-java zoneid