آموزش رمزگذاری کاراکتر در HTML

3 سال پیش

آموزش رمزگذاری کاراکتر در HTML

در این درس از مجموعه آموزش برنامه نویسی سایت سورس باران، به آموزش رمزگذاری کاراکتر در HTML خواهیم پرداخت.

رمزگذاری کاراکتر روشی برای تبدیل بایت به کاراکتر است. برای اعتبار سنجی یا نمایش صحیح یک سند HTML، یک برنامه باید کدگذاری کاراکتر مناسب را انتخاب کند.

رایج ترین مجموعه کاراکترها یا رمزگذاری کاراکترها در رایانه ها ASCII است –

American Standard Code برای تبادل اطلاعات، احتمالاً پرکاربردترین مجموعه کاراکترها برای رمزگذاری متن به صورت الکترونیکی است.

رمزگذاری ASCII فقط از الفبای لاتین بزرگ و کوچک، اعداد ۰-۹ و برخی از کاراکتر های اضافی پشتیبانی می کند که در مجموع ۱۲۸ حرف را ایجاد می کند. می توانید نگاهی به مجموعه کاملی از نویسه های قابل چاپ ASCII داشته باشید

با این حال، بسیاری از زبان ها از حروف لاتین برجسته یا حروف الفبا کاملاً متفاوت استفاده می کنند. اگر می خواهید از کاراکتر های غیر ASCII استفاده کنید، باید در مورد رمزگذاری کاراکتر اطلاعات کسب کنید.

سازمان بین المللی استانداردسازی، طیف وسیعی از ست کاراکتر ها را برای برخورد با کاراکتر های مختلف ملت های دیگر ایجاد کرد. برای اسناد به زبان انگلیسی و اکثر زبانهای اروپای غربی، از رمزگذاری گسترده پشتیبانی شده ISO-8859-1 استفاده می شود.

در اینجا لیستی از ست کاراکتر مورد استفاده در سراسر جهان به همراه توضیحات آنها آورده شده است.

ست کاراکتر و توضیحات
۱ ISO-8859-1

الفبای لاتین قسمت ۱

آمریکای شمالی، اروپای غربی، آمریکای لاتین، کارائیب، کانادا، آفریقا

۲ ISO-8859-2

الفبای لاتین قسمت ۲

اروپای شرقی

۳ ISO-8859-3

الفبای لاتین قسمت ۳

اروپا، اسپرانتو، سایر موارد

۴ ISO-8859-4

الفبای لاتین قسمت ۴

اسکاندیناوی / بالتیک (و موارد دیگر در ISO-8859-1 نیستند)

۵ ISO-8859-5

الفبای لاتین / سیریلیک قسمت ۵

۶ ISO-8859-6

الفبای لاتین / عربی قسمت ۶

۷ ISO-8859-7

الفبای لاتین / یونانی قسمت ۷

۸ ISO-8859-8

الفبای لاتین / عبری قسمت ۸

۹ ISO-8859-9

الفبای لاتین قسمت ۹

همان ISO-8859-1 می باشد به جز کاراکتر های ترکی که جایگزین حروف ایسلندی هستند

۱۰ ISO-8859-10

Latin 6 Latin 6 Lappish, Nordic, and Eskimo

۱۱ ISO-8859-15

همان ISO-8859-1 اما با کاراکتر های بیشتر اضافه شده است

۱۲ ISO-2022-JP

الفبای لاتین / ژاپنی قسمت ۱

۱۳ ISO-2022-JP-2

الفبای لاتین / ژاپنی قسمت ۲

۱۴ ISO-2022-KR

الفبای لاتین / کره ای قسمت ۱

 

 

کنسرسیوم یونیکد به منظور ایجاد راهی برای نشان دادن همه کاراکتر های زبانهای مختلف، به جای داشتن این کدهای مختلف کاراکتر ناسازگار برای زبانهای مختلف، راه اندازی شد.

بنابراین، اگر می خواهید اسنادی ایجاد کنید که از کاراکترهای مجموعه های مختلف کاراکتر استفاده می کنند، می توانید این کار را با استفاده از رمزگذاری های کاراکتر یونیکد انجام دهید.

بنابراین یونیکد، رمزگذاری هایی را مشخص می کند که می توانند با یک رشته از راه های خاصی برخورد کند تا فضای کافی برای مجموعه کاراکترهای بزرگی که در آن قرار دارد ایجاد کنند. اینها به UTF8 ، UTF-16 و UTF-32 معروف هستند.

ست کاراکتر و توضیحات
۱ UTF-8

ک کاراکتر در UTF8 می تواند از ۱ تا ۴ بایت باشد و باعث ایجاد عرض متغیر در UTF8 می شود.

۲ UTF-16

یک قالب ترجمه یونیکد که در واحد های ۱۶ بیتی وجود دارد. طول آن می تواند ۱ یا ۲ شورت باشد و باعث ایجاد عرض متغیر در UTF16 شود. .

۳ UTF-32

یک قالب ترجمه یونیکد که در واحدهای ۳۲ بیتی وجود دارد، یعنی طولانی است. این یک قالب با عرض ثابت است و طول آن همیشه ۱  است.

 

۲۵۶ کاراکتر اول از مجموعه کاراکترهای یونیکد با ۲۵۶ کاراکتر ISO-8859-1 مطابقت دارند.

به طور پیش فرض، پردازنده های HTML 4 باید از UTF-8 پشتیبانی کنند و پردازنده های XML قرار است از UTF-8 و UTF-16 پشتیبانی کنند. بنابراین تمام پردازنده های سازگار با XHTML همچنین باید از UTF-16 پشتیبانی کنند.

 

منبع.

لیست جلسات قبل آموزش HTML

    1. معرفی HTML
    2. نگاهی کلی به HTML
    3. آموزش تگ های پایه در HTML
    4. آموزش عناصر در HTML
    5. مفهوم ویژگی ها در HTML
    6. آموزش قالب بندی در HTML
    7. آموزش تگ های عبارت در HTML
    8. آموزش متا تگ ها در HTML 
    9. آموزش کامنت ها در HTML
    10. تصاویر در HTML
    11. آموزش جداول در HTML
    12. آموزش لیست ها در HTML
    13. آموزش لینک های عکس در HTML
    14. آموزش لینک های ایمیل در HTML
    15.  آموزش فریم ها در HTML
    16. آموزش Iframes در HTML
    17. آموزش بلوک در HTML
    18. آموزش پس زمینه در HTML
    19. آموزش رنگ ها در HTML
    20. آموزش فونت ها در HTML
    21. آموزش فرم ها در HTML
    22. آموزش چندرسانه ای در HTML 
    23. مفهوم Marquee در HTML 
    24. آموزش تگ Header در HTML
    25. آموزش Style Sheet در HTML
    26. مرجع تگ ها در HTML 
    27. مرجع ویژگی ها در HTML
    28. مرجع رویدادها در HTML
    29. مرجع فونت ها در HTML 
    30. کدهای ASCII در HTML
    31.  جدول ASCII در HTML
    32. آموزش نام رنگ ها در HTML 
    33. آموزش موجودیت ها در HTML
    34. آموزش فونت های استاندارد HTML / XHTML
    35. آموزش منابع رویدادها در HTML
    36. آموزش انواع رسانه های MIME در HTML
    37. آموزش رمزگذاری URL در HTML
    38. کدهای ISO زبان در HTML
0
برچسب ها :
نویسنده مطلب erfan molaei

دیدگاه شما

بدون دیدگاه