Senin, 06 Juni 2011

Web Sciene


BAB 1

World Wide Web adalah suatu teknologi yang baru berusia beberapa tahun, namun
pertumbuhannya, dan dampaknya terhadap masyarakat sangat menakjubkan. Awal nya adalah untuk mendukung informasi persyaratan penelitian fisik energi tinggi.
Hal ini telah menyebar ke dalam disiplin ilmu lain, akademisi pada umumnya, perdagangan, hiburan, politik, dan hampir di mana saja. Hal ini bebas dari kendala pencetakan dan fisik distribusi, hasil penelitian ilmiah, dan data pada saat mana penelitian yang dilakukan, bisa dibagi dengan cepat.
Menghubungkan,dan memungkinkan pekerjaan berada dalam konteks yang kayadan luas. Sementara itu, inovasi telah memperluas kemungkinan untuk berkomunikasi. Weblogs
dan wiki memungkinkan kedekatan percakapan, sedangkan potensi
multimedia dan interaktivitas sangat luas. Tapi baik Web maupun dunia yang keduanya bersifat statis. Web berkembang untuk menanggapi berbagai dorongan dari ilmu pengetahuan, perdagangan, masyarakat dan politik. Sebagai contoh, pertumbuhan e-science telah menciptakan suatu kebutuhan untuk mengintegrasikan sebagian besar jumlah data yang beragam dan heterogen; e-government dan e-commerce juga menuntut lebih efektif menggunakan informasi.

Kita perlu memahami kekuatan-kekuatan evolusi dan perkembanganTanpa seperti peluang apresiasi untuk menambahkan nilai pada web dengan memfasilitasi kemungkinan lebih komunikatif dan representasi mungkin akan terjawab. Tapi pembangunan bukan seluruh dari cerita. Meskipun multi-faceted dan extensible, Web didasarkan pada seperangkat prinsip-prinsip arsitektur yang perlu dihormati. Selanjutnya, Web adalah teknologi sosial yang berkembang pada pertumbuhan dan oleh karena itu perlu dipercaya dengan memperluas basis pengguna ,jaminan mutu, self control atas informasi, dan menghormati hak-hak dan preferensi lain semua aspek penting dari Web.
Aspek ini juga harus dipahami dan dipelihara sebagai perubahan Web. Agenda penelitian yang dapat membantu mengidentifikasi apa yang perlu di pertahankan dan di mana perubahan bisa menguntungkan adalah keharusan. Ini adalah tujuan dari Ilmu web, yang bertujuan untuk memetakan bagaimana desentralisasi informasi struktur dapat melayani secara ilmiah ilmiah, representasi dan komunikasi persyaratan, dan untuk menghasilkan desain dan prinsip desain yang mengatur struktur seperti [34]. Kami berpendapat bahwa ini ilmu desentralisasi struktur informasi adalah penting untuk memahami bagaimana informal
dan informasi link yang tidak direncanakan antara manusia, agen, database, organisasi dan aktor-aktor lain dan sumber daya dapat memenuhi informasi kebutuhan driver yang penting seperti e-science dan e-government.

Bagaimana sistem dasarnya desentralisasi dapat memiliki performa seperti
dirancang ke dalamnya adalah pertanyaan kunci dari Web Ilmu [34].:
Web Ilmu' adalah ungkapan ambigu. Ilmu Fisik
adalah disiplin analitik yang bertujuan untuk menemukan hukum yang menghasilkan atau menjelaskan fenomena yang diamati, ilmu komputer adalah sebagian besar (walaupun tidak
eksklusif) sintetis, dalam formalisms dan algoritma diciptakan dalam rangka mendukung perilaku yang diinginkan tertentu.
Ilmu web harus merupakan penggabungan dari kedua paradigma, Web perlu dipelajari dan
dipahami, dan perlu direkayasa. Pada skala mikro, Web adalah infrastruktur bahasa buatan dan protokol, yang merupakan bagian dari rekayasa. Tapi filosofi menghubungkan yang mengatur Web, dan yang digunakan dalam komunikasi, mengakibatkan sifat muncul pada skala makro (Beberapa yang diinginkan, dan karenanya harus direkayasa dalam, yang lain
tidak diinginkan, dan jika mungkin untuk direkayasa keluar). Dan tentu saja Penggunaan Web dalam komunikasi adalah bagian dari sistem yang lebih luas interaksi manusia diatur oleh konvensi dan hukum. Berbagai tingkat di whichWeb teknologi berinteraksi dengan masyarakat manusia berarti bahwa interdisciplinarity adalah kebutuhan perusahaan Web Science.
Seperti agenda interdisipliner penelitian, mampu mendorong pembangunan Web sosial dan ilmiah dalam cara yang berguna, belum terlihat dan perlu diciptakan. Untuk itu, pada bulan September 2005, sebuah Workshop Ilmu Web diselenggarakan di London, Inggris (rincian kontributorke Workshop diberikan dalam Ucapan Terima Kasih).
Lokakarya memeriksa sejumlah isu, termasuk:
• Muncul tren di Web.
• Tantangan untuk memahami dan membimbing pengembangan
Web.
• Menyusun penelitian untuk mendukung eksploitasi peluang
dibuat oleh (antara lain) mana-mana, mobilitas, media baru
dan peningkatan jumlah data yang tersedia secara online.
• Memastikan sifat sosial yang penting seperti privasi
dihormati.
• Mengidentifikasi dan melestarikan invariants penting dari theWeb
pengalaman.

Teks ini tumbuh dari Lokakarya Web science, dan ia mencoba untuk meringkas, memperluas dan mengomentari perdebatan. Bahwa interdisipliner diperlukan pendekatan disepakati oleh semua, mencakup komputer ilmu pengetahuan dan teknik, ilmu-ilmu fisika dan matematika, sosial ilmu pengetahuan dan kebijakan. Ilmu web, oleh karena itu, tidak hanya tentang metode untuk memodelkan, menganalisis dan memahami Web pada
mikro-dan makroskopik berbagai tingkatan. Hal ini juga tentang teknik protokol dan menyediakan infrastruktur, dan memastikan bahwa ada sesuai antara infrastruktur dan masyarakat yang host itu.
Ilmu web harus berkoordinasi rekayasa dengan agenda sosial, kebijakan dengan teknis
kendala dan kemungkinan, analisis dengan sintesis - itu inheren lintas disiplin, dan teks ini disusun untuk mencerminkan itu. Mengembangkan theWeb juga melibatkan menentukan apa faktor yang mempengaruh pengalaman Web, dan memastikan bahwa mereka tetap di tempat.
Contoh
keputusan arsitektur dasar yang mendukung meliputi Web: 404
kesalahan, yang berarti bahwa kegagalan untuk link ke sumber daya tidak menimbulkan bencana kegagalan; penggunaan Uniform Resource Indicator (URI).
Pendahuluan 5
eksploitasi penuh dari infrastruktur Internet yang sudah ada (seperti Domain Name System) sebagai platform yang theWeb dibangun. Standar juga penting, dan World Wide Web Consortium's (W3C) bekerja untuk menciptakan dan merekomendasikan standar tetap menjaga konsensus stakeholder menunjukkan bahwa rekayasa perlu pergi tangan di
tangan dengan proses negosiasi sosial.

Bagian 2 adalah tinjauan prinsip-prinsip ilmiah dan arsitektur dasar lebih terinci. Menjelajahi metafora dari 'evolusi' dapat membantu kita untuk menggambarkan Web sebagai ekologi populasi, dan sebagai masyarakat dengan persyaratan sosial biasa, kebijakan,dan aturan. Menghubungkan relevan pendekatan, yang meliputi metodologi varian, bervariasi spatiotemporal ukuran butir dan pemodelan di berbagai domain, akan menantang.

Bagian 3 membahas beberapa isu yang harus dilakukan dengan rekayasa Web, dan bagaimana mempromosikan, dan dipromosikan oleh, teknologi baru seperti sebagai grid atau jasa. Mungkin salah satu potensi perkembangan yang paling penting yang akan dibahas dalam bagian ini adalah SemanticWeb. Web biasanya ditandai sebagai jaringan banyak dokumen terkait yang dirancang untuk dibaca oleh manusia, sehingga mesin-pembacaan membutuhkan heuristik pengolahan bahasa alami. Namun, Semantic
Web, merupakan visi untuk memperluas dan menambahkan nilai ke Web, dimaksudkan untuk mengeksploitasi kemungkinan pernyataan logis atas data relasional terkait untuk memungkinkan otomatisasi pengolahan informasi yang banyak. Penelitian dan pembangunan telah berlangsung selama beberapa waktu sekarang pada pengembangan
bahasa dan formalisms yang akan mendukung query, inferensi, menyelaraskan model data, visualisasi dan pemodelan.

Untuk berkembang, Web Semantic kebutuhan filosofi desentralisasi yang sama sebagai World Wide Web. Salah satu tantangan adalah untuk memastikan bahwa berbagai
data individu sistem dapat digabung dengan konsistensi lokal tanpa mencoba tugas yang tidak mungkin untuk menegakkan konsistensi global. Selain itu, penggunaan dasar seperangkat simbol -URI - oleh sejumlah formalisms dengan sifat yang kontras, seperti
aturan dan logika, tanpa mengasumsikan apapun formalisme terpusat atau 'dasar' untuk menggambarkan Web juga non-sepele. Masalah ketiga adalah untuk melakukan dengan membawa data bersama-sama untuk memanfaatkan kekuatan amalgamasi dan kebetulan kembali; paling data yang saat ini duduk di repositori mandiri 

BAB 2

Kita mungkin memparafrase Web Sains sebagai ilmu dari Web. Sementara ini kesetaraan mungkin jelas apabila kita mulai dengan memecah frase dan membuat sketsa komponen yang memungkinkan Web berfungsi sebagai sistem informasi efektif yang terdesentralisasi. Kami akan meninjau dasar prinsip arsitektur dari Web, yang dirancang untuk mendukung pertumbuhan dan nilai sosial perilaku berbagi sebuah informasi dan dapat dipercaya,dalam Bagian 2.1.
Bagian 2.2 akan menawarkan beberapa refleksi metodologis pada penyelidikan ilmiah dari Web.

Web 2.1 arsitektur

Arsitektur dari Web merupakan eksploitasi teknologi sederhana yang terhubung secara efisien untuk mengaktifkan ruang informasi yang sangat fleksibel dan
bermanfaat, dan skala yang paling penting. Web saat ini mengesankan platform tempat ribuan bunga telah mekar,dan harapan itu dapat tumbuh lebih lanjut, meliputi bahasa lebih lanjut, media dan kegiatan yang lebih banyak, hosting informasi lebih lanjut, serta menyediakan alat dan metode untuk menginterogasi data yang keluar. Dalam bagianpembukaan ini kita akan meninjau secara singkat prinsip utama yang mendasari web arsitekture.

Web adalah ruang di mana sumber daya yang diidentifikasi olehUniform Resource Identifier (URI - [33]). Ada protokol untuk mendukung interaksi antara agen, dan format untuk mewakili informasi source. Ini adalah bahan dasar dari Web.
Desain mereka tergantung utilitas dan efisiensi interaksi Web, dan desain yang tergantung pada gilirannya pada sejumlah prinsip, beberapa diantaranya merupakan bagian dari konsepsi asli, sementara yang lain harus belajar dari pengalaman.

Identifikasi sumber daya penting untuk dapat berbagi informasi tentang mereka, alasan tentang mereka, memodifikasi atau pertukaranmereka.
Sumber daya tersebut dapat berupa apa saja yang dapat dihubungkan ataudibicarakan; banyak sumber daya adalah murni informasi, tetapi yang lain tidak. Selanjutnya, tidak semua sumber daya yang di Web, di bahwa mereka mungkin dapat diidentifikasidari
Web, tetapi tidak mungkin dapat diambil dari itu. Sumber daya yang
pada dasarnya informasi, dan yang karenanya dapat diberikan tanpa
abstraksi dan dicirikan sepenuhnya dalam pesan disebut
SOURCE INFORMATION.

Untuk penalaran dan fungsi mengacu terjadi pada skala global, sistem identifikasi diperlukan untuk menyediakan satu global
standar; URI menyediakan sistem itu. URI bertindak sebagai nama (dan
alamat - lihat Bagian 3.1.2 di bawah ini untuk pembahasan masalah ini), dan sebagainya apakah mungkin untuk menebak sifat sumber daya dari perusahaan URI, yangmerupakan Hal kontingen, dalam URI umumnya mengacu kepada opaquely.


Prinsip-prinsip hubungan antara URI dan sumber daya yang diinginkan tetapi tidak tegas dilaksanakan , biaya gagal mengaitkan URI dengan sumber daya adalah ketidakmampuan untuk merujuk ke sana, sedangkan biaya penempatan dua sumber
ke URI akan error, sebagai data tentang salah satu sumber daya akan diterapkan ke
lainnya.

URI juga menghubungkan Web dengan dunia sosial offline, mereka mewajibkan lembaga. Mereka berada di bawah skema didefinisikan tertentu, yang mungkin yang paling umum dipahami adalah HTTP, FTP dan mailto. Skema tersebut terdaftar dengan internet Ditugaskan Nomor Authority (IANA -http://www.iana.org/assignments/urischemes).
Skema ini harus dioperasikan pada jalur berprinsip pada Order agar efektif.

Jadi jika kita ambil HTTP sebagai contoh, HTTP URI dimiliki dan menyalurkan
oleh orang atau organisasi, dan maka dapat dialokasikan secara bertanggung jawab
atau tidak bertanggung jawab. Sebagai contoh, sebuah URI HTTP harus mengacu kesumber tunggal, dan dialokasikan untuk pemilik tunggal. Hal ini juga diinginkan untuk suatu URI untuk merujuk kepada sumber daya yang permanen, dan tidakmengubah referensi dari waktu ke waktu (lihat Bagian 5.4.6 di bawah).
Komunikasi melalui Web melibatkan pertukaran pesan yang dapat berisi data atau
metadata tentang sumber daya. Salah satu tujuan umum dari komunikasi adalah
mengakses sumber daya melalui URI, atau untuk dereference URI. Jika sumber daya telah diberi sebuah identifier, sumber daya harus dalam beberapa cara yang dapat diperoleh kembali dari pengenal agar bisa nilai. Dereferencing biasanya
melibatkan menemukan indeks yang tepat untuk mencari pengenal. Ada sering petunjuk dalam pengenal, atau penggunaan bantuan identifier, yang
di sini, terutama jika pihak berwenang dalam penamaan memiliki semacam hirarki
struktur.

Web mendukung berbagai format file, yang paling terkenal adalah HTML. Beberapa format yang diperlukan, dan format perlu fleksibel, karena sifat heterogen dari interaksi antar web. Konten dapat diakses melalui segala macam perangkat, paling sering ialah dengan PC atau perangkat mobile, dan nilai lebih dapat diekstraksi dari
Web jika penyajian konten adalah perangkat-independen sejauh mungkin
(Idealnya kompatibel dengan perangkat yang belum terbayangkan). Memisahkan
representasi dari isi dari keprihatinan presentasi dan interaksi adalah praktik yang baik di sini; bawah seperti konten, rezim, presentasi dan interaksi perlu digabungkan dengan cara yang bermanfaat secara maksimal, yang umumnya dilakukan sebagian oleh server dan sebagian oleh klien, rasio yang tepat antara kedua tergantung pada konteks interaksi.

Kekuatan Web berasal dari Melinkannya sehingga memungkinkan.
Sebuah sumber daya dapat berisi referensi ke sumber lain dalam bentuk yang tertanam dalam URI yang dapat digunakan untuk mengakses sumber daya kedua.
Link ini memungkinkan navigasi asosiatif theWeb. Untuk memudahkan untuk hubungan ,format harus mencakup cara untuk membuat dan mengidentifikasi link ke sumber daya lainnya,dan juga harus memungkinkan link ke setiap sumber daya di mana saja melalui Web, dan tanpa membatasi penulis konten untuk menggunakan skema tertentu URI.
Sebuah tujuan penting dari Web Ilmu adalah untuk mengidentifikasi aspek-aspek penting seperti identifikasi, interaksi dan representasi yang membuat Web
Work, dan untuk memungkinkan pelaksanaan sistem yang dapat mendukung
atau mempromosikan perilaku yang diinginkan. Pengalaman menghubungkan dokumen ,dan semakin, data rilis kekuatan besar, baik untuk penulis dan pengguna.
Kemungkinan kembali kebetulan konten memberdayakan penulis untuk meningkatkan pengaruh mereka, dan pengguna dengan menyediakan akses informasi yang lebih dari yang dapat terealisasi dengan menggunakan teknologi lainnya.

Secara khusus, tiga fungsi identifikasi, interaksi dan representasi harus dipisahkan. Mengubah atau menambahkan skema untuk identifikasi, misalnya, seharusnya tidak berpengaruh pada skema untuk interaksi atau representasi, memungkinkan independen, evolusi modular arsitektur web sebagai teknologi baru dan aplikasi baru mulai beroperasi (Yang tidak berarti bahwa spesifikasi ortogonal tidak mungkin co-berevolusi siklis dengan satu sama lain). Demikian pula, teknologi harus diperluas,yaitu mereka harus mampu berkembang secara terpisah tanpa mengancam interoperabilitas mereka dengan teknologi lainnya.

Akhirnya, prinsip penting arsitektur Web yang error harus ditangani secara sederhana dan fleksibel. Kesalahan sangat penting - dalam sebuah informasi
ruang yang ukurannya dapat diukur dalam ribuan terabyte, dan jumlah pengguna dalam ratusan juta, heterogenitas tujuan dan kualitas beragam kepengarangan berarti bahwa akan ada banyak sekali kesalahan desain. Keberadaan link menjuntai (link menggunakan URI tanpa sumber daya di akhir itu), konten yang tidak baik-formed atau lainnya , kesalahan yang ditebak seharusnya tidak menyebabkan sistem crash, tuntutan interoperabilitas mengharuskan bahwa agen harus dapat pulih dari kesalahan, tanpa kompromi kesadaran pengguna bahwa kesalahan
telah terjadi.

Sebagai web yang tumbuh dan berkembang untuk memenuhi situasi baru dan tujuan, arsitektur harus berkembang. Tapi evolusi perlu bertahap dan hati-hati (yang lambat dan selalu telaten negosiasi standar komite adalah cara yang baik untuk menggabungkan gradualisme dengan Kehebatan untuk tujuan), dan prinsip menjaga perkembangan ortogonal terpisah berarti bahwa evolusi di satu daerah tidak boleh mempengaruhi evolusi tempat lain. Evolusi perlu menghormati invariants penting dari sebuah Web, seperti ruang URI, dan penting bahwa pengembang setiap saat bekerja untuk melestarikan aspek-aspek Web yang perlu diawetkan.
Ini merupakan bagian dari misi dari W3C Teknis Arsitektur Kelompok [154], meskipun standar dapat hanya pernah menjadi bagian dari cerita. prinsip-prinsip arsitektur Web akan selalu diperdebatkan di luar W3C, cukup baik, serta di dalamnya.









Web 2.2 Metodologi

Jika penyelidikan dari Web yang akan dihitung sebagai benar ilmiah,
maka pertanyaan segera adalah bagaimana metode ilmiah harus berlaku untuk domain tertentu. Bagaimana seharusnya peneliti dan insinyur pendekatan Web untuk memahami dan hubungannya dengan masyarakat luas, dan untuk berinovasi?
Berbagai aspek dari Web relatif baik dipahami, dan sebagai artefak direkayasa blok bangunan yang dibuat, bukan fenomena alam.
Namun demikian, sebagai Web telah berkembang dalam kompleksitas dan jumlah dan jenis interaksi yang terjadi telah membengkak, tetap kasus yang kita tahu lebih banyak tentang beberapa fenomena alam yang kompleks (contoh jelas adalah genom manusia) dari yang kita lakukan dalam hal ini khusus direkayasa salah satunya

Untuk mengambil satu contoh, ada sejumlah teknologi dan metode untuk pemetaan Web dan menandai keluar topologi nya (lihat Bagian 4.1 di bawah ini). Apa peta seperti kepada kita (lih. misalnya [80])? . Para visualisasi seringkali sangat mengesankan, dengan tiga dimensi interpretasi dan warna-kode link antara node. Tapi bagaimana diverifikasi adalah peta seperti itu? Dalam apa indra mereka memberitahu kita 'bagaimana Web adalah'? Apa keterbatasan?

Aplikasi jelas, dalam hal metodologis, peta dan grafik struktur Web adalah untuk langsung sampling, dengan menentukan properti yang model dan sampel dari Web seharusnya. Pertumbuhan pesat dari Web membuat survei lengkap pertanyaan tahun lalu, dan ilmuwan kebutuhan informasi statistik yang cepat dan tepat waktu tentang isi sastra Web tersedia. Perwakilan sampling adalah kunci untuk metode tersebut, tapi bagaimana seharusnya sebuah sampel dikumpulkan untuk menjadi tepat disebut wakil [188]? Untuk menjadi benar bermanfaat, sampel harus acak; 'keacakan' biasanya didefinisikan untuk domain tertentu, dan pada umumnya berarti bahwa semua individu dalam domain memiliki probabilitas yang sama untuk terpilih sebagai sampel.

Tapi untuk Web yang perlu, misalnya, memahami apa yang individu, misalnya, apakah kita peduli dengan website atau halaman Web? Jika yang pertama, maka orang bisa membayangkan kesulitan karena tidak ada pencacahan lengkap dari mereka. Dan metode sampling berdasarkan, mengatakan, alamat IP yang rumit oleh penduduk tentu jarang dari ruang alamat [219].


Selanjutnya, meskipun untuk banyak tujuan Web dapat dianggap sebagai ruang informasi statis, tentunya dinamis dan berkembang.
Jadi segala upaya untuk memahami longitudinal Web akan perlu evolusi itu ke dalam rekening [218], dan model idealnya harus memiliki pertumbuhan sistem (dalam hal penambahan konstan simpul baru dan tepi ke dalam grafik), bersama-sama denganlink struktur yang tidak invarian dari waktu ke waktu, dan hubungan domain hirarki yang senantiasa rentan terhadap revisi, dibangun ke dalam mereka (lih. misalnya [253]).

Analytic pemodelan dikombinasikan dengan data empiris yang dikumpulkan dengan hati-hati dapat digunakan untuk menentukan probabilitas halaman Web yang sedang diedit (mengubah konten informasi mereka) atau tidak dihapus. Salah satu percobaan pengawasan ratusan ribu halaman selama beberapa bulan membuahkan hasil yang menarik: setiap putaran satu waktu sekitar 20% dari laman web di bawah 11 hari tua, sedangkan 50% muncul di tiga bulan sebelumnya. Di sisi lain, 25% lebih dari berumur tahun - usia yang didefinisikan di sini sebagai selisih antara waktu modifikasi terakhir ke halaman dan waktu download [43].

Percobaan lain yang terlibat merayapi 150m halaman HTML sekali seminggu selama 11 minggu, dan menemukan, misalnya, hubungan yang kuat antara top-level domain dan frekuensi perubahan (. halaman com diubah lebih sering daripada gov atau. halaman edu.), dan bahwa dokumen-dokumen besar (mungkin counterintuitively) mengubah lebih sering dari yang kecil.Frekuensi perubahan terakhir adalah prediktor yang baik dari perubahan masa depan, hasil potensial penting bagi perayap Web incremental [99]. Perkembangan metode sampling Web feed dengan sangat cepat ke dalam pengembangan pencarian lebih efisien dan akurat. Metode untuk menemukan informasi secara online, baik logis atau heuristik, apakah data-berpusat atau pada model sistem temu kembali informasi, membutuhkan pemetaan yang akurat.

Jadi salah satu aspek dari Web Ilmu adalah penyelidikan dari Web untuk tempat ancaman, peluang dan invariants untuk pengembangannya. Lain adalah teknik baru, metode mungkin tak terduga berurusan dengan informasi, yang menciptakan ekstensi non-konservatif dari Web. teknik tersebut dapat berbasis penelitian, atau industri berbasis.

Sintesis sistem baru, bahasa, algoritma dan alat-alat adalah kunci untuk pengembangan koheren dari Web, seperti, misalnya, dengan studi tentang sistem kognitif, dimana banyak kemajuan beberapa tahun terakhir telah datang dengan teknik eksplorasi serta sebagai analisis dan deskripsi (lih. misalnya [51]). Jadi, misalnya, satu-satunya cara untuk menemukan efek dari file sharing radikal desentralisasi adalah untuk mengembangkan peer to peer sistem dan operasi mereka amati pada skala semakin besar. Seperti upaya rekayasa perintis sangat penting untuk pengembangan Web, melainkan setelah semua konstruksi. Hal ini penting untuk Web secara keseluruhan bahwa implementasi sistem berinteraksi dan tidak mengganggu, yang mana badan standar memainkan peranan penting.

Oleh karena itu Web Sains adalah kombinasi dari sintesis, analisis dan pemerintahan.
Dalam sisa teks ini, kami akan mengambil tiga aspek pada gilirannya,
dimulai dengan sintesis, maka analisis, dan kemudian isu-isu sosial yang
berdampak pada pengembangan Web, sebelum berakhir dengan diskusi
masalah pemerintahan.

BAB 3
 
Tujuan dari web of science adalah pelacakan pengembangan web, yang menentukan inovasi baik dan yang buruk, dan memberikan kontribusi bagi perkembangan menguntungkan. Pada bagian ini kita akan meninjau beberapa petunjuk pembangun web. Web adalah arsitektur berprinsip standar, bahasa dan formalisms yang menyediakan platform untuk aplikasi yang heterogen (banyak). Beberapa tuntutan di web mengharuskan membuat suatu model yang ekspresif. Desain web semantik terkait formalisms dimaksudkan untuk memperpanjang menutupi data terkait. Web Semantik merupakan upaya memperluas potensi web dengan ekstensi analog perilaku manusia. Jadi visi web semantik adalah perluasan dari prinsip-prinsip web dari dokumen untuk data. Data yang akan dibagi akan efektif dan lebih luas. Tujuan dari web semantik adalah memfasilitasi menggunakan data serta penemuan mereka, melalui Google dalam hal ini. Dalam konteks ini adalah layak disebut perbedaan antara pengambilan informasi dan pengambilan data. Tujuan pertama adalah untuk menghasilkan dokumen yang relevan dan query. Model data web semantik sangat berhubungan dengan dunia relasional data. Sebuah database relasional adalah tabel yang terdiri dari catatan yang merupakan baris. Semacam ini database adalah jenis sumber pengetahuan sebagai dasar web semantik. Jadi web semantik adalah perpanjangan WWW dalam al yang menjadi tahap berikutnya menghubungkan data tidak dokumen. Hal ini dimaksudkan untuk berfungsi dalam konteks model relasional data. Menghubungkan adalah kunci untuk web semantik tersebut. RDF dan OWL memungkinkan pertukaran data dalam konteks dunia nyata. Visi asli dari web semantik telah dirumuskan dalam bentuk diagram berlapis. Pengembangan proses web semantik bergerak ke atas, dengan perhubungan RDF OWL di tengah.
Pada tradisional konsepsi, ontologi berisi spesifikasi dari konsep yang diperlukan untuk memahami sebuah domain, dan kosa kata yang diperlukan untuk masuk ke dalam wacana tentang hal itu, dan bagaimana konsep-konsep dan kosa kata saling berhubungan, bagaimana kelas dan contoh dan sifat mereka didefinisikan, dijelaskan dan disebut. Sebuah ontologi dapat formal atau informal. Keuntungan dari formalitas adalah bahwa hal itu membuat ontologi mesin-dibaca, dan karena itu memungkinkan mesin untuk melakukan lebih dalam penalaran atas sumber daya web. Kerugiannya adalah bahwa seperti formal konstruksi yang dianggap sulit untuk dibuat.
Desentralisasi adalah masalah dari sudut pandang logis, meskipun besar keuntungan dari yang pencipta konten. Kegagalan referensi unik relatif sepele bagi pengguna manusia untuk menguraikan, tetapi tentu saja sangat sulit bagi mesin untuk bekerja keluar. Dan
jika kita berharap untuk mengekstrak informasi yang berguna dari repositori yang sangat besar informasi, dimana kerajinan tangan solusi dan referensi memeriksa oleh mata tidak layak, pengolahan mesin tidak bisa dihindari. Referensi masalah yang sangat mungkin terjadi ketika sumber-sumber informasi digabung, masalah di mana-mana tapi yang serius dalam konteks dari Web Semantic. Sebuah metode heuristik untuk menyelesaikan bentrokan tersebut, di dunia nyata, adalah untuk membuat penilaian cerdas berdasarkan informasi jaminan, dan ini telah menirukan online dengan perhitungan komunitas praktek nama, berdasarkan jaringan hubungan sekitarnya masing-masing instansi yang disengketakan.
Alternatif mengambil masalah referensi adalah bahwa penentuan ketika dua halaman web adalah halaman yang sama. Dasar untuk membuat penilaian kemiripan tidak perlu hanya menjadi konten pada halaman, tetapi juga bisa menjadi struktur hyperlink dalam halaman yang tertanam. Informasi yang mengharuskan pengguna tidak perlu berasal dari satu halaman, tapi malah bisa dipetik dari cluster dokumen seputar topik dasar, dan hubungan yang struktur ada bisa sangat penting. Pembangunan Web adalah campuran dari standar-setting, tidak terstruktur, desentralisasi kegiatan dan inovasi, dan rekayasa yang disengaja. Pada bagian ini kita akan fokus pada yang terakhir, dan review menonjol teknik isu dan keharusan terbuka. Pertumbuhan Web jelas merupakan sesuatu yg diinginkan kunci. Penyimpanan jumlah semakin besar informasi, dalam konteks perhitungan pernah-cepat, akan sangat vital untuk
masa mendatang. Layanan area utama di mana kami rekayasa model kebutuhan Web untuk terlibat dan jasa extended.Web didistribusikan potongan kode ditulis untuk memecahkan tugas-tugas tertentu, yang dapat berkomunikasi dengan layanan lain melalui pesan. Tugas yang berskala lebih luas dapat dianalisis dan secara rekursif dipecah menjadi sub-tugas yang dengan peta keberuntungan akan ke spesifik tugas-tugas yang dapat diatasi oleh layanan. Ada banyak lingkungan hardware yang akan Web diharapkan untuk menembus, namun di mana teknik asumsi yang berlaku untuk skala besar, lebih-atau-kurang tetap mesin komputasi khusus tidak harus berlaku. Contoh nyata termasuk komputasi mobile, di mana-mana (atau meresap) komputasi mana interoperabilitas menjadi masalah, P2P sistem dan komputasi grid. Komputasi Mobile membuat segala macam tuntutan rekayasa, daya komputasi yang tersedia tidak luas dan pengguna harus diasumsikan terus-menerus bergerak dengan variabel bandwidth dan akses. Selain itu, menyajikan informasi kepada pengguna
Sering mengklaim bahwa personalisasi itu penting untuk meningkatkan
nilai dari suatu jaringan, dan meningkatkan konsumen lock-in. Mengizinkan pengguna untuk menyesuaikan alat-alat mereka dan berarti ruang kerja yang Web tetap lebih dari commoditised satu ukuran cocok untuk semua daerah dan malah menjadi sebuah ruang di mana orang dapat mengukir sendiri niche. Selain itu, mereka juga harus dapat menerima layanan yang lebih baik, disesuaikan dengan keadaan khusus mereka sendiri dan preferensi. Web adalah lingkungan multimedia, yang membuat untuk kompleks semantik – ini tentu saja tidak masalah yang unik ke Web. Metareasoning dan epistemologi sering menganggap media tekstual, bahkan meskipun sebenarnya banyak penalaran dalam bentuk analog. Misalnya ahli sering menggunakan diagram untuk mengekspresikan pengetahuan mereka.

BAB 4
Analisis Web adalah pengukuran, pengumpulan, analisis dan pelaporan data internet untuk tujuan memahami dan mengoptimalkan penggunaan web. Web analytics bukan hanya alat untuk mengukur lalu lintas situs Web tetapi dapat digunakan sebagai alat untuk penelitian bisnis dan riset pasar. Web analytics aplikasi juga dapat membantu perusahaan mengukur hasil kampanye iklan cetak tradisional. Ini membantu seseorang untuk memperkirakan bagaimana lalu lintas ke situs web berubah setelah peluncuran kampanye iklan baru. analisis Web menyediakan data tentang jumlah pengunjung, tampilan halaman, dll untuk mengukur lalu lintas dan tren popularitas yang membantu melakukan riset pasar.
Ada dua kategori analisis web luar lokasi dan di situs web analisis.
Secara historis, analisis web telah disebut pengukuran pengunjung di tempat. Namun dalam beberapa tahun terakhir ini telah kabur, terutama karena vendor yang memproduksi peralatan yang menjangkau kedua kategori.
Situs web analisis ON teknologi
Banyak vendor yang berbeda memberikan-situs web pada analisis perangkat lunak dan jasa. Ada dua pendekatan teknologi utama untuk mengumpulkan data. Metode pertama yaitu analisis logfile, membaca file log di mana web server mencatat semua transaksi perusahaan. Metode kedua yaitu tag halaman, menggunakan JAvaScript pada setiap halaman untuk memberitahu sebuah server pihak ketiga saat halaman diberikan oleh web browser . Keduanya mengumpulkan data yang dapat diolah untuk menghasilkan laporan web lalu lintas.
Selain itu sumber data lain juga dapat ditambahkan untuk menambah data. Misalnya; mail tingkat respon-e, data kampanye direct mail, penjualan dan informasi memimpin, kinerja data pengguna seperti klik pemetaan panas , atau metrik kustom lain yang diperlukan.
Web server merekam beberapa transaksi mereka di sebuah file log. Hal ini segera menyadari bahwa file log dapat dibaca oleh program untuk menyediakan data tentang popularitas website. Maka muncullah analisis perangkat lunak web .
Pada awal 1990-an, web statistik situs terutama terdiri dari menghitung jumlah permintaan klien (atau hit) dibuat untuk web server. Ini adalah metode yang masuk akal pada awalnya, karena setiap situs web sering terdiri dari sebuah file HTML tunggal. Namun, dengan pengenalan gambar dalam HTML, dan situs web yang membentang beberapa file HTML, jumlah ini menjadi kurang bermanfaat.Yang pertama benar komersial Log Analyzer dirilis oleh IPRO pada tahun 1994 .
Dua unit ukuran diperkenalkan pada pertengahan tahun 1990 untuk mengukur secara lebih akurat jumlah aktivitas manusia pada server web. Ini adalah tampilan halaman dan kunjungan (atau sesi). Sebuahtampilan halaman didefinisikan sebagai permintaan dibuat untuk server web untuk halaman, sebagai lawan dari grafis, sementara mengunjungididefinisikan sebagai urutan permintaan dari klien diidentifikasi unik yang berakhir setelah jumlah tertentu tidak aktif, biasanya 30 menit . Halaman tampilan dan kunjungan masih sering ditampilkan metrik, namun kini dianggap lebih sederhana.
Munculnya search engine spide dan robot pada akhir tahun 1990an, bersama dengan proxy web dan alamat IP yang ditetapkan secara dinamis untuk perusahaan besar dan ISP , membuatnya lebih sulit untuk mengidentifikasi pengunjung manusia unik ke situs web. Log analisis menanggapi dengan melacak kunjungan oleh cookie , dan dengan mengabaikan permintaan dari laba-laba dikenal.
Penggunaan ekstensif web cache juga disajikan masalah untuk analisis logfile. Jika seseorang mengunjungi kembali halaman, permintaan kedua akan sering diambil dari cache browser, sehingga permintaan tidak akan diterima oleh server web. Ini berarti bahwa jalan seseorang melalui situs hilang. Caching dapat dikalahkan dengan mengkonfigurasi server web, tetapi hal ini dapat mengakibatkan performa yang terdegradasi untuk pengunjung ke situs web.
Topologi WEB
Belajar sifat-sifat dari Web sebagai objek formal menyediakan cukup banyak pengaruh untuk desainer dari sistembaru, dan badan standar yang tugasnya adalah menemukan dan menjaga variasi dari pengalaman Web padaskala besar. Pada bagian ini kita akan meninjau secara singkat upaya untuk mendeskripsikan topologi web.
Topologi Web
* Struktur Web
Investigasi topologi dilakukan untuk memahami bentuk dasar dari arsitektur dan relasi diantara keduanya. Struktur dapat memberi kita banyak informasi. Penyelidikan struktur dari web selalu tergantung dari level pemisahan dari pendeskripsian struktur web. Seperti contohnya saja ukuran web yang mungkin memiliki perbedaan sangat kecil dalam kinerja dari komponennya mampu memberikan perbedaan besar di level makro.
Pemahaman struktur sangat penting untuk sejumlah aplikasi, seperti navigasi, pencarian, menyediakan sumber daya untuk mendukung komunitas online, atau efek dari perubahan mendadak dalam permintaan informasi.
Topologi Web berisi kompleksitas dari rantai linear sederhana. Pada bagian ini, kita akan membahas upaya untukmengukur struktur global dari Web, dan bagaimana halaman web individu dapat masuk ke dalam konteks itu
* Penelitian teoritis graph
Mungkin paradigma yang paling terkenal untuk mempelajari Web adalah teori grafik. Web dapat dilihat sebagaigrafik yang besar pada tengah halaman dan bagian tepinya adalah link. Karena weblinks sangat sedikitberantakan, jelas bahwa tepi grafik mengkodekan banyak struktur yang terlihat oleh desainer dan penulis konten yang bagi mereka adalah sama pentingnya.
Konektivitas webgraph telah dianalisis secara rinci, menggunakan struktural seperti indikator seperti bagaimananode yang terhubung. Berbagai makro struktur scopic telah dilihat dan diukur, misalnya satu merangkak dari lebihdari 200 juta halaman menemukan bahwa 90% dari Web sebenarnya tersambung. Struktur berik
utnya seringdisebut sebagai bentuk bowtie, seperti yang ditunjukkan pada Gambar di bawah. Simpul dasi sangat berhubungancluster (SCC) dari webgraph di mana terdapat jalur antara setiap pasangan node. SCC ini diapit oleh dua setcluster, mereka yang dihubungkan (link) ke SCC tetapi dari yang tidak ada backlink (ditandai sebagai DI dalam gambar), dan mereka yang terkait dari SCC tetapi tidak link kembali (OUT). Hubungan antara SCC, IN dan OUTmemberikan bentuk bowtie. Implikasi dari penemuan ini masih topologi perlu dipahami. Meskipun beberapa telahmengusulkan perubahan terhadap algoritma PageRank untuk mengambil keuntungan dari topologi dasar, masih ada banyak pekerjaan yang harus dilakukan untuk mengeksploitasi struktur terlihat.

Struktur bowtie lazim di berbagai skala. Dill di al telah menemukan bahwa himpunan bagian yang lebih kecil dari Web juga memiliki bentuk bowtie, sebuah petunjuk bahwa Web mempunyai sifat fractal yang menarik karakteristiksebagai Web pada umumnya.
Memang, pertanyaan skala dipotong dua arah. Ada yang lain, lebih kecil dari Web sekitar, dan web itu sendiridatang sebagai sesuatu dari kejutan bagi matematikawan dan ilmuwan komputer pada saat itu dimulai, sekarangstudi Web cenderung melihat Web. Struktur tersebut sebagai Intranets mempunyai sifat yang sangat berbeda,dalam hal ukuran, konektivitas, koherensi dan pencarian sifat; beberapa sifat terbawa dari Internet secara keseluruhan, sementara yang lainnya tidak. Telah ada sedikit pekerjaan atas struktur kontras, meskipun melihat untuk investigasi Intranet, dan subgraphs sesuai dengan topik scientific tertentu . Web cukup jarang tersambung,berarti bahwa subgraph disebabkan oleh satu set acak node akan hampir kosong, tetapi jika kita mencarikelompok non-acak (cluster tematis-bersatu atau TUCs) yang jauh lebih dihubungkan, maka kita melihat bentukbowtie muncul lagi. Setiap TUC akan memiliki SCC sendiri, dan sendiri IN dan OUT sisi, termuat di dalam SCCyang lebih luas. SCC skala yang lebih besar, karena sangat berhubungan, kemudian dapat bertindak sebagaitulang punggung navigasi antara TUCs.
Matematika WEB
Opez L 'Ortiz, dalam surveinya, terlihat di sejumlah paradigma berguna untuk memahami dasar-dasar algoritmikInternet pada umumnya dan Web pada khususnya. Menerapkan wawasan tentang algoritma masalah jaringan,dalam konteks protokol tertentu mendasari Web, berpotensi sangat bermanfaat. Pertumbuhan dari Web, sepertiOpez L ‘Ortiz tunjukkan, adalah yang paling canggih dari teks algoritma pengindeksan yang beroperasi baik di dalam zona kenyamanan mereka dalam aplikasi standar pada awal tahun 1995, namun berjuang keras pada akhirtahun itu.

*Model rasional
Salah satu paradigma penting adalah bahwa dari ekonomi mikro, mathemat diskrit ics, teori pilihan rasional dan teori permainan. Meskipun pengguna individu mungkin atau mungkin tidak "rasional",itu telah lama mencatat bahwa secara masal orang berperilaku sebagai maximisers utilitas. Dalam hal ini,pemahaman insentif yang tersedia bagi pengguna Web harus menyediakan metode untuk model menghasilkanperilaku, dan karenanya pandangan tentang apa global set perilaku yang diinginkan bisa direkayasa, dan apa yangbisa system mendukung perilaku tersebut.



Jika, seperti dalam Gambar di atas, kurva penawaran adalah elastis sempurna (misalnya horizontal), ada tigakesetimbangan: dua titik di mana suplai persilangan kurva kurva permintaan (pada jaringan ukuran B dan C), dan titik di mana kurva penawaran hits sumbu y (A = 0). Jika jaringan ukuran tetap pada 0, maka permintaan tetap nihil,dan kami tinggal di posisi A. Pada C, posisi ini juga stabil; jaringan berisi semua customers siap untuk membayartarif pasar, dan tidak bisa tumbuh karena ada tidak ada orang lain siap untuk membayar. Jika jaringan tumbuh, itu harus karena harga telah jatuh (yaitu kurva penawaran telah bergerak ke bawah; jika menyusut jaringan, yang harus karena seseorang telah mengubah preferensi dan sekarang tidak lagi siap untuk membayar harga pasar(yaitu kurva permintaan telah bergerak ke bawah). Jika kita berasumsi bahwa dua kurva tetap diam, maka setiap perubahan akan mengakibatkan slip kembali ke C. Kuncinya adalah B, yang meskipun suatu kesetimbangan tidak stabil. Jika ukuran jaringan tergelincir di bawah B, maka tidak cukup banyak orang akan siap untuk membayartingkat pasar dan permintaan secara bertahap akan tergelincir kembali ke nol. Jika di sisi lain bisa mendapatkandari B, maka tiba-tiba banyak lebih banyak konsumen akan muncul yang siap untuk membayar harga pasar ataulebih, dan ukuran jaringan akan meningkat secara dramatis, mendapatkan lebih dari punuk kurva permintaan danmencapai C. Jadi B adalah massa kritis untuk jaringan.

* Model Pencarian Keterangan
Sebuah paradigma penting kedua adalah bahwa pencarian informasi. IR adalah fokus untuk perlombaan senjataantara algoritma untuk mengekstrak informasi dari repositori yang kedua repositori mendapatkan lebih besar danlebih kompleks, dan tuntutan pengguna lebih sulit untuk memuaskan (baik dalam hal respon waktu ataukompleksitas dari query).

Mungkin lebih tepatnya, IR tradisional telah digunakan di jinak lingkungan di mana massa data ditambang untuknugget akal; masalah khas adalah kompleksitas dan kurangnya pola. Benchmark koleksi dokumen bagi para peneliti IR cenderung berkualitas tinggi dan hampir tidak pernah sengaja menyesatkan, seperti koleksi ilmiah makalah dalam jurnal khusus. Web-lain seperti mini-struktur yang dapat digunakan, seperti Intranet, juga ditandaidengan itikad baik dengan informasi yang disajikan. Namun upaya berbahaya untuk menumbangkan sangat IRsistem yang theWeb dukungan baik yang semakin umum. IR berbasis web harus menghadapi tidak hanya skaladan kompleksitas informasi, tetapi upaya potensi untuk condong hasilnya dengan konten dimaksudkan ntukmenyesatkan.

* Struktur Berbasis Pencarian
Hasil IR yang benar-benar dibawa ke dalam usia pencarian Web adalah penemuan bahwa adalah mungkin untukmembuat perbedaan heuristik antara link tersebut yang muncul untuk menunjukkan kualitas terkait-ke situs, danmereka yang tidak, hanya berdasarkan perhitungan nilai eigen matriks yang berhubungan dengan struktur linksubgraphs lokal. Juga tidak HITS algoritma juga tidak Kleinberg Page et al PageRank dibutuhkan dalam lainmasukan dari struktur dinyatakan uninterpreted dari hyperlink ke dan dari halaman Web.

Search engine juga harus berjuang untuk tetap saat ini, oleh Mengindeks ulang sesering mungkin, konsistendengan menekan biaya, sebagai Web tumbuh dan halaman individu diedit atau diubah sebagai database mendasari mereka mengubah. Search engine dapat dibandingkan dengan menggunakan berbagai parameter,baik itu liputan mereka (jumlah hits kembali query yang diberikan, terutama melihat jumlah hits hanya dicapai olehmesin pencari), relevansi dari halaman kembali; waktu diambil, atau kualitas kembali. Sebagai salah satuharapkan, mesin yang berbeda melakukannya dengan baik pada metrik yang berbeda.

* Metode Matematika untuk Menggambarkan Struktur
Memahami matematika dan topologi dari Web adalah praktis impor untuk memahami invariants dari pengalamanWeb dan Oleh karena itu menyediakan peta jalan untuk ekstensi untuk theWeb. Yang penting properti yangmemiliki Web adalah ketahanan dalam menghadapi pengaruh undermining; baik hacker maupun kesalahan yang tak terelakkan dalam fisik jaringan sangat mengganggu theWeb, meskipun sesuatu seperti satu router dalamempat puluh turun di setiap saat satu. ASI Barab dan kolega advokasi.

Di sisi lain, teori perkolasi menunjukkan bahwa skala bebas karya agak lebih rentan terhadap terarah, seranganterkoordinasi, bahkan jika mereka tahan terhadap kegagalan acak. Non-acak kegagalan bisa merusak jika merekamenargetkan situs yang sangat terhubung, kegagalan sejumlah kecil hub secara dramatis dapat meningkatkan diameter Web (dalam hal jumlah terkecil klik diperlukan untuk pergi dari satu halaman yang dipilih secara acaklain), dan kegagalan dari sejumlah besar situs yang sangat-tersambung bisa menyebabkan fragmentasi.

* Metode Matematika untuk Menggambarkan Layanan
Sebagai Web berkembang untuk memasukkan model layanan, di mana perangkat lunak agen dan layanan Webakan hidup online dan dipanggil oleh pengguna, dan di mana metafora yang semakin penting adalah bahwa klienmenghubungi penyedia layanan, representasi matematika baru, formalisms dan teori menjadi berguna untuk menggambarkan hubungan ini.

Ada kebutuhan untuk bahasa untuk menggambarkan layanan web (seperti CDL atau BPEL), dan mungkin bahwa matematika yang tercantum di sini bisa mendukung bahasa tersebut. Ada hidup perdebatan tentang jala Petri danπ-kalkulus, berfokus pada manfaat relatif dari, jaring negara berbasis grafis, dan semakin tekstual, linier, aljabarevent.


BAB 5


Web adalah bagian dari komputasi dalam pengaturan sosial dan perkembangannya yang mendapat hak embedding seperti melakukan rekayasa. Pada bagian ini kita akan melihat sosial, kognitif, dan konteks moral dari web.
Arti, Supervenience, dan landasan simbol
Web sering disebut sebagai seperangkat lapisan sengan standar, bahasa dan protokol yang bertindak sebagai platform baru yang lebih kaya, lebih ekspresif, dan formalis. Platform tersebut seperti TCP / IP. Web Semantic sudah jelas contoh arsitektur berlapis namun unprescriptive.
Satu pandangan mengingatkan pada gagasan filosofis supervenience, salah satu wacana atau serangkaian ekspresi A memerlukan perubahan dalam B namun tidak sebaliknya. Jadi pada teori pikiran supervenience, setiap perubahan dalam mental memerlukan beberapa perubahan di bagian otak, namun perubahan di otak tidak perlu mengakibatkan perubahan pada kondisi mental. Supervenience adalah sebuah konsep yang kurang kuat dari pengurangan (teori reduksionis dari pikiran / otak berarti orang bisa menyimpulkan keadaan mental dari negara bagian otak, psikologi bahwa berikut dari neuroscience). Dalam dunia pengolahan mesin dan interoperabilitas data, banyak penggunaan atau wacana adalah secara otomatis oleh komputer. Untuk alasan itu, tidak jelas bahwa definisi dalam kata-kata, atau kode, atau menggunakan cukup spesifik, tidak akan cukup untuk dijabarkan istilah untuk Web Semantic dengan akurasi yang cukup untuk memungkinkan deduksi logis untuk mengambil tempat. Stabilitas dari referen kunci URI, misalnya, bisa memungkinkan banyak otomasi dalam spesifik topik daerah – gagasan ilmu sebagai makna mendasari mengingatkan
dari teori Hilary Putnam. Fakta bahwa Semantic Web bekerja di dunia data relasional, dengan mesin melakukan banyak kerja, berarti bahwa tidak selalu berwewenang untuk menyelesaikan masalah definisi dan logika yang telah terbukti sangat tahan terhadap analisis dalam dunia bahasa alamiah.
5.2 Web Penalaran
5.2.1 Ubah Plus ¸ca ?
Isu dalam ilmu web dengan akar semantik, filosofis atau logis. Ini bukan pertama kalinya bahwa praktisi paradigma komputasi tiba-tiba harus membiasakan diri dengan Philosophical Logic. Proyek umum AI mencoba untuk menghasilkan umum beradaptasi mesalah pemecah berdasarkan deskripsi simbolik dan penalaran yang kuat dari penelitian AI dan akhirnya kandas pada kesulitan menentukan segala sesuatu yang diperlukan untuk komputer untuk alasan tentang situasi sewenang-wenang. Beberapa berpendapat bahwa GOFAI terhambat oleh kegagalan untuk memecahkan bingkai masalah.
Di sisi lain, klaim bahwa Web, dan SW tertentu, akan memukul masalah yang sama seperti GOFAI harus dilihat dalam konteks berbagi, manipulasi dan interogasi dari relasional data seperti yang disebutkan pada program SW. Data yang sudah dibagi dan digabung dalam sejumlah konteks oleh aplikasi tujuan khusus, yang bersama mendasari ontologi dengan pemetaan yang relevan dan terjemahan. Terjemahan ini tidak perlu bersifat universal, dan tidak perlu bertujuan untuk menghasilkan suatu ontologi yang konsisten secara global. SW generalises semacam ini pendekatan untuk sistem data bersama dengan mengembangkan standar untuk pemetaan antara set data; argumen lebih lanjut diperlukan untuk menetapkan bahwa program ini akan jatuh busuk keberatan standar dan praktis hambatan untuk GOFAI. Tujuan SW adalah untuk menghasilkan ekstensi ke Web yang akan memungkinkan lebih informasi yang akan diproduksi lebih mudah dalam menanggapi pertanyaan. GOFAI bertujuan untuk menghasilkan suatu sistem yang cerdas menunjukkan manusia-tingkat intelijen; SW harus membantu sesuatu yang tingkat kecerdasan manusia (Biasanya seorang manusia) dalam akuisisi penemuan informasi sehari-hari, dan pemrosesan. Ada juga argumen bahwa ontologi tampaknya kurang bermasalah bila dilihat dari perspektif ini. Setidaknya satu komentator telah melihat SW sebagai calon penyelamat dari sistem pakar program penelitian.
5.2.2 Alternatif Cara Penalaran
Salah satu kandidat yang jelas adalah penalaran asosiatif, dimana penalaran atas dasar asosiasi – yang dapat sangat tidak terduga dan personalisasi – mengambil satu menuruni kereta pemikiran. Jadi, misalnya, kasus klasik penalaran asosiatif diberikan dalam novel Proust Remembrance of Things Past, di mana narator setengah baya, setelah makan Madeleine yang telah dicelup dalam teh, menemukan dirinya diangkut ke masa kecilnya di Combray, ketika Bibi eonie L’akan memberinya Madeleine pada hari Minggu pagi. Di Web, potensi penalaran asosiatif sangat besar, mengingat jumlah besar hyperlink asosiatif, dan sifat dunia kecil dari Web. Google-seperti pencarian.
Asosiatif penalaran, misalnya, telah digunakan untuk kolaborasi dalam sistem penyaringan rekomendasi. Di Web, potensi penalaran asosiatif sangat besar, mengingat jumlah besar hyperlink asosiatif, dan sifat dunia kecil dari Web. Google-seperti pencarian, berharga meskipun mereka diragukan lagi adalah, tidak bisa seluruh cerita di dunia kecil merasuk perangkat, perangkat lunak agen dan sistem terdistribusi. Namun, asosiatif penalaran melalui hyperlink, meskipun yang menarik dan metode penting, bukan satu-satunya cara untuk pergi tentang itu. Jenis ini penalaran tidak sepenuhnya penalaran asosiatif yang tepat, sebagai asosiasi adalah dari penulis, orang yang menempatkan hyperlink ke dokumen. Dalam adegan Proust, hal ini seperti Marcel mengambil gigitan nya Madeleine dan tiba-tiba dan tak terduga mempersepsikan kenangan tukang roti. Buka hyperlink memungkinkan pembaca untuk menempatkan struktur link lebih dari yang ada halaman Web, menggunakan informasi seperti metadata tentang halaman yang dimaksud, ontologi yang relevan dan model user. Associativity jelas salah satu kekuatan pendorong utama dari Web sebagai toko pengetahuan dan sumber informasi. Asosiatif penalaran, misalnya, telah digunakan untuk kolaborasi dalam sistem penyaringan rekomendasi.
Tipe lain dari penalaran adalah penalaran analogis, sangat lain pasti jenis penalaran bahwa manusia sangat berhasil menggunakan. Penalaran dengan bekerja analogi dengan mengenali karakteristik serupa antara dua subyek, dan kemudian dengan asumsi bahwa mereka subyek memiliki karakteristik lebih banyak kesamaan – khusus bahwa jika subjek A memiliki aset P, maka dengan analogi begitu juga subjek B. Kasus berbasis penalaran (CBR) adalah jenis baik dieksplorasi penalaran analogis. Sketsa suatu pendekatan menggunakan penalaran analogi untuk menghasilkan metadata tentang sumber daya telah muncul baru-baru ini, dan penjelasan berbasis kasus dapat berguna dalam domain mana model kausal yang lemah. Dalam sebuah domain dijelaskan oleh beberapa ontologi, teknik penalaran analogi juga mungkin berguna sebagai penalaran yang bergerak dari satu set deskripsi ontologis terhadap lain, meskipun sama perubahan sudut pandang juga dapat mempersulit hal. Ada telah mencoba menarik untuk mendukung analogis penalaran (yaitu CBR) di seluruh pengetahuan desentralisasi seperti kompleks struktur, dan juga ekstensi untuk XML untuk mengungkapkan kasus berbasis pengetahuan.
5.2.3 Penalaran bawah Inkonsistensi
Web adalah media demokratis. sesuatu di theWeb ditegaskan oleh beberapa formula dalam dokumen, tetapi berbeda dokumen tidak perlu dipercaya pada tingkat yang sama. Terkait dengan dokumen akan metadata dari berbagai jenis, yang dapat membantu memutuskan apakah pernyataan dalam satu dokumen harus menimpa penyangkalan tempat lain. Atau, ini merupakan kesempatan aplikasi untuk paraconsistent logika, yang memungkinkan ekspresi inkonsistensi tanpa terkait deduktif free-untuk-semua. Logika Paraconsistent melokalisasi efek ketidakkonsistenan, dan sering memerlukan relevansi semantik proposisi digunakan dalam pengurangan. Bahwa pemodelan Web adalah penting untuk beberapa tujuan di mana bukti yang diperlukan tentang apa yang mensyaratkan oleh serangkaian laporan (untuk Misalnya, dalam menemukan apakah informasi telah digunakan dengan benar atau salah.
5.3 Web Epistemologi
Komputer telah merevolusi epistemologi, dan yang paling Web dari semua. Gerakan e-science telah terbukti sangat menarik. Filosofis, metode ilmiah telah terbukti sulit untuk memakukan, tapi ini sebagian karena logis struktur penelitian dan kesimpulan yang pasti dirusak oleh manusia dan sifat kolektif dari proses, yang berarti bahwa sosial proses, proses politik dan heuristik penemuan setidaknya sebagai penting sebagai logika. Salah satu tujuan dari Web adalah untuk memfasilitasi diskusi rasional ide-ide, bukan jenis serangan ad hominem yang membentuk agak terlalu banyak dari apa yang secara longgar disebut perdebatan. Dan kedua, Web memiliki struktur desentralisasi radikal.
5.4 Web Sosiologi
Web adalah cermin untuk masyarakat manusia, dan mencerminkan kepentingan, obsesi dan keharusan eksistensi manusia abad ke-21 diperpanjang selama jangkauan yang sangat luas (mungkin jangkauan terluas dari setiap informasi manusia ruang) nilai, budaya set dan asumsi. Analisis pencarian syarat diketik ke Google mungkin menjadi sumber kunci untuk sejarawan masa depan. Pada bagian ini kita akan melihat hubungan antara Web dan penggunanya, pembaca dan penulis. beberapa orang ingin menggunakan Web untuk berbagi informasi, beberapa untuk liburan dan hiburan, beberapa ingin untuk mengeksploitasi informasi yang didistribusikan di Web untuk melakukan ilmu dengan cara-cara baru yang radikal, yang lain menginginkan arena untuk perdagangan, sementara masih lain ingin membuat dan orang-orang semacam utopia anarkis yang telah terbukti offline begitu sulit dipahami.
5.4.1 Komunitas Kepentingan
Web telah melahirkan sejumlah komunitas menarik dan novel dengan sifat menarik. Sebagai contoh, Massively Multiplayer Online Peran-Playing Game (MMORPG), di mana penerbit menyediakan gigih ruang online di mana permainan berlangsung. Web dan Internet pada umumnya, mendukung jenis baru interaksi, dan memberikan perspektif abad ke-21 pada beberapa lama yang. survei terbaru telah menemukan peningkatan besar dalam jumlah orang menjual sesuatu online, menggunakan mesin pencari, menggunakan Webcam dan mendengarkan podcast. Web, dan lainnya baru teknologi seperti komputer luas telah memungkinkan konsep-konsep baru ruang untuk mengembangkan dan mendukung metode baru berinteraksi online, atau interaksi baru antara ruang virtual, ruang fisik atau ruang teoritis atau diukur seperti peta dan rencana. Web interaksi yang penting sehubungan dengan masyarakat yang ada di tiga cara: meningkatkan transparansi, memungkinkan komunitas offline untuk tumbuh luar ‘alami’ mereka batas-batas, dan memungkinkan berbeda, lebih dikodifikasikan, jenis komunikasi antara anggota masyarakat. Dan Web Ilmu kebutuhan tidak hanya analisis efektif interaksi pengguna “di alam bebas” sehingga untuk berbicara; ini harus berjalan seiring dengan perkembangan teori (Baik di tingkat sosiologis dan teknis) tentang apa itu tentang sukses partisipatif teknologi seperti RSS, folksonomi, wiki dan blog, yang umum di seluruh ruang.
5.4.2 Informasi Struktur dan Struktur Sosial
Struktur sosial dari Web tergantung pada struktur rekayasa yang mendasari tingkat. Web adalah refleksi dari kehidupan intelektual dan sosial manusia, tetapi juga secara khusus direkayasa untuk menjadi alat. Secara khusus, struktur theWeb adalah sebuah muka lain yang lebih tradisional struktur data. Untuk terstruktur, lingkungan terpusat di mana kontrol penting, ini adalah inovasi penting. Inovasi rekayasa dari Web adalah apa yang menciptakan nilai tambah untuk pengguna manusianya. Pengembangan URI memungkinkan cepat dan traversal tidak dibatasi ruang informasi ke segala arah; dari setiap titik dalam satu ruang web bisa mencapai titik lain dengan segera (satu dapat memilih untuk dibatasi oleh link berikut atau output dari pencarian
mesin, tentu saja).
5.4.3 Signifikansi dan metrik
Ada beberapa metode untuk memperbaiki penafsiran berbagai potensi intuisi seperti melalui beberapa matematika keras, yang merupakan cara yang baik untuk mulai memahami sosial dimensi Web. Dan pemahaman pentingnya halaman adalah penting untuk tugas non-sepele halaman pemesanan diambil selama Web pencarian dan pengambilan. Signifikansi dapat didekomposisi menjadi dua jenis metrik: relevansi dan kualitas.
Selain konektivitas hyperlink sederhana, lebih canggih langkah-langkah didasarkan pada model ruang vektor yang dokumen dan query dipandang sebagai vektor. Jadi, misalnya, TFxIDF memberikan relevansi sebuah skor ke dokumen berdasarkan jumlah bobot dari istilah permintaan dinormalisasi dengan panjang vektor Euclidian dokumen; bobot istilah dihitung sebagai produk-salib Term Frekuensi (TF) dan Frekuensi Dokumen Invers (IDF). Sebuah TF adalah ukuran dari frekuensi kemunculan istilah dalam dokumen, sedangkan IDF adalah mengukur jumlah dokumen terkait yang berisi istilah. TFxIDF gagal memperhitungkan informasi penting yang disediakan oleh koneksi hyperlink halaman, tapi bahkan termasuk seperti informasi dalam suatu algoritma yang lebih luas tidak mengungguli TFxIDF oleh jarak besar. Lain mengukur relevansi jelas dalam e-commerce atau e-publishing lingkungan adalah untuk mengukur jumlah download per kunjungi. Pola seperti penggunaan dan akuisisi dapat dipelajari untuk menghasilkan peta atau jejak jalan bahwa pengetahuan sedang ditransfer ke dan digunakan oleh komunitas pengguna. Percobaan di sepanjang garis-garis ini telah menunjukkan bahwa perubahan signifikan sering terjadi sangat tiba-tiba, bersama terkait acara-acara seperti pembuatan link ke sumber daya dari luar situs, atau beberapa diskusi situs oleh komentator eksternal. Struktur hyperlink di mana halaman web menemukan konteksnya juga informatif tentang proxy kualitas. Jika ada link dari satu halaman ke lain, yang dapat dibaca sebagai dukungan dari kertas kedua dengan yang pertama. Itu adalah hipotesis yg dpt dibatalkan yang tergantung untuk sebagian besar pada perilaku orang-orang yang benar-benar menciptakan halaman web – ternyata bahwa sejumlah besar link yang memang mendukung dokumen lainnya untuk beberapa derajat, bahkan jika hanya sebagai alternatif sumber informasi tentang topik yang sama. Ukuran matematika ini tertanam dengan kuat di kontingen sosiologi Web. Selanjutnya, metode tersebut dapat diterapkan ke item multimedia di Web yang tidak mungkin mengandung terutama menarik teks yang untuk mencari, seperti misalnya dengan sistem temu bergambar PicASHOW.
5.4.4 Kepercayaan dan reputasi
Kepercayaan adalah, tentu saja, merupakan faktor penting dalam pengembangan Web, dengan berbagai bidang. Web services dipercaya untuk melakukan apa yang mereka katakan mereka akan melakukan tanpa kerusakan kepada orang lain. E-commerce situs yang dipercaya untuk membuat penggunaan yang tepat dari rincian kartu kredit, untuk mengirim barang yang dipesan, dan untuk menjaga data yang aman. Arsitektur dari Web, yang secara eksplisit memfasilitasi anonimitas dan menyalin akurat, membuat kepercayaan sangat penting masalah. Belajar online kepercayaan sangat sulit karena beberapa konteks di mana terjadi interaksi secara online. Sebuah survei terbaru menemukan bahwa penelitian sering gagal untuk membedakan antara kepercayaan, penyebab kepercayaan dan pendahulunya yang dapat dipercaya. Kepercayaan adalah berbagai pasti, ‘harapan percaya diri’ sebagai ‘kesediaan menjadi rentan’, ‘a sikap positif umum ‘. Kepercayaan adalah juga bukan statis Fenomena, itu adalah dinamis, sering ada periode waktu di mana kepercayaan sebuah situs dibangun. Pengguna web pada berbagai tingkat pengalaman juga memiliki tingkat kepercayaan yang khas yang berbeda.
Struktur Web telah terbukti sugestif dalam hal ini lapangan, dalam struktur yang sangat Web-seperti yang membuat Anda ke sewenang-wenang halaman web di World Wide Web juga bisa membuat Anda cepat untuk kesaksian seseorang yang Anda tidak tahu di Web Trust. Trust, seperti yang sering ditunjukkan, tidak transitif (yaitu, jika A B percaya dan B trust C, itu tidak berarti bahwa A trust C). Itu tampaknya akan melemahkan Web pendekatan Trust. Namun, jika A trust B, B percaya C dan B merekomendasikan C ke A, maka itu merupakan alasan untuk A percaya C. rantai akan memecah akhirnya, tetapi belum tentu segera, dan mungkin menurunkan anggun. Jadi selama pengertian tentang degradasi dibangun ke generasi ukuran kepercayaan berdasarkan Web pendekatan Trust, maka masih mungkin untuk model atau menghasilkan kepercayaan berdasarkan laporan saksi mata atau pendapat disimpan. Ini telah berpendapat bahwa expressivity dari Web Semantic diperlukan untuk memastikan bahwa agregasi informasi kepercayaan tidak hanya heuristic di alam; itu adalah isi dari atribusi dari kepercayaan atau dinyatakan yang diperhitungkan. Setelah seseorang menerbitkan sebuah file yang mengatakan yang mereka tahu dan berapa banyak mereka percaya mereka, bahwa informasi sosial dapat diproses tanpa perantara.
5.4.5 Trust (II): bukti Mechanising
Telah dikatakan bahwa budaya kita sekarang berurusan dengan dua pengertian tentang bukti. Dalam satu tampilan, seperti Wittgenstein berpendapat, sebuah bukti adalah gambar yang berdiri di membutuhkan ratifikasi, yang akan saat kita bekerja melalui itu; itu meyakinkan kita. Ini menjelaskan dan menunjukkan kebenaran proposisi terbukti secara bersamaan. Jenis lain bukti mekanis dan algoritmik, ini mungkin lebih dapat diandalkan daripada bukti-gambar sebagai-, tetapi untuk dapat diterima memerlukan itu diambil pada kepercayaan bahwa langkah-langkah dalam bukti harus dilakukan dengan benar. Kepercayaan diperlukan (a) karena bukti mungkin unsurveyable, dan (b) bahkan jika tidak tidak efisien atau biaya-efektif untuk memeriksa setiap bukti mekanis dengan tangan. Wittgenstein tidak hidup untuk melihat bukti mekanik kompleks menjadi biasa, tapi ia mencurahkan waktu untuk berpikir tentang implikasi, dalam (pada saat itu tidak biasa) pandangannya matematika sebagai kegiatan, dan berhati-hati untuk membedakan antara bukti-gambar sebagai-dan mekanik bukti. Dia menyimpulkan bahwa keputusan kita untuk percaya mekanis bukti secara sukarela dan bahwa hasil mereka tidak dipaksa kami. Saat ini, lebih banyak aspek kehidupan sehari-hari (keuangan, kesehatan dan keamanan, fungsi utilitas) berada di bawah naungan sistem otomatis. Dan ketika Web mengambil lebih banyak informasi rutin pengguna pengolahan tugas (seperti dengan SW), kebutuhan atas kepercayaan manusia dalam sistem mekanik adalah jauh lebih besar. Banyak kepercayaan yang merupakan fungsi tak terduga dari pengalaman, dan kita tidak dapat meniadakan kebutuhan untuk kepercayaan dalam penilaian manusia kolektif serta mesin sendiri. Hubungan antara kepercayaan dalam diri kolektif kami dan kepercayaan di hardware dan software adalah satu sulit untuk menguraikan, namun pengembangan Web akan tergantung krusial di atasnya.

5.4.6 Web Moralitas dan Aspek Konvensional Menggunakan Web
Moral dan pertanyaan etika adalah bagian penting dari Web Science agenda. Kesederhanaan hubungan antara URI dan khusus Web sumber daya merupakan kunci untuk meningkatkan ruang informasi. Upaya untuk menumbangkan hubungan ini bisa sangat merusak dan Semantic Web.
Namun ada peran untuk Web Ilmu untuk menentukan apa praktek-praktek rekayasa yang penting, dan bagaimana mereka berhubungan dengan kesediaan orang untuk berperilaku dengan cara yang kooperatif. Analisis semacam itu dapat menyebabkan kode perilaku yang mungkin tidak berlaku tetapi dalam arti menentukan moral perilaku dalam konteks Web. Moralitas dan putar rekayasa keluar yang akan dihubungkan. Beberapa tekanan disebabkan oleh kesulitan rekayasa asli, tekanan beberapa hanya godaan atau kemalasan. Tapi Web akan berfungsi URI lebih baik jika tidak berubah, jika mereka selalu menunjuk ke dokumen yang sama (Yang tentu saja dapat diperbarui secara berkala). Jumlah kerja link sebenarnya menurun cukup pesat. Sebuah eksperimen yang disebutkan sebelumnya merangkak 150m laman web selama 11 minggu, dan pada minggu ke-9 para peneliti telah kehilangan akses ke lebih dari 10% dari mereka halaman (sekitar 4% telah hilang dalam minggu pertama). Sekitar 3% kembali 4XX kesalahan, kebanyakan dari mereka 404 kesalahan (tidak ditemukan), dan sebagian besar the 403s sisanya (dilarang). Sekitar 3% dari halaman diblokir oleh Web server ‘robots.txt file yang terdeteksi dan ditolak crawler Web. 2 – 3% dari kegagalan adalah jaringan terkait, seperti DNS lookup kegagalan, koneksi ditolak atau timeout TCP, sementara sekitar 2% adalah 3xx kesalahan, menunjukkan halaman telah pindah. Yang bersih dan Domain com tampaknya pelanggar terburuk. Tapi kode etik dan jenis lain diskusi tentang Web dapat membuat konsensus tentang apa yang merupakan tugas online dan apa yang merupakan perilaku buruk (konteks adalah penting: mengapa spam suatu zat iritasi yang serius, dan surat sampah relatif kecil?) dan, akibatnya, tentang perilaku apa yang harus disahkan, apa yang diamanatkan, dan apa fungsi terkait arsitektur mungkin diharapkan untuk menyediakan. 


BAB 6
Pengetahuan, klisenya adalah kekuasaan. Sebuah web secara dramatis menggeser struktur yang mendasari pengetahuan dan aksesibilitas dan telah mengubah struktur kekuasaan dengan cara-cara yang tak terduga. Kekuasaan telah bergeser, dan ini menimbulkan pertanyaan tentang pemerintahan Web. Bagaimana seharusnya hal-hal diatur untuk memastikan perkembangan yang berkesinambungan dari sebuah Web?

Kita telah lihat, dalam Bagian 5.4.6, peraturan tidak bisa menjawab segalanya. Masalah umum dari penguasaan web adalah bahwa dengan struktur desentralisasi sulit untuk menegakkan standar, dan dengan jumlah yang sangat besar dari pengguna yang tidak terlatih atau relatif tidak tertarik hal-hal sederhana yang harus dijaga. Tapi kesederhanaan itu tidak dapat diijinkan untuk dipertahankan dan dilaksanakan kepada orang-orang yang mampu merumuskan kebijakan tentang akses dan kontrol. Hal ini dikatakan bahwa kurangnya kontrol informasi telah menghambat pertumbuhan Web dengan membuat masyarakat enggan untuk menghadirkan suatu informasi dan membaginya dengan masyarakat.

Penyedia informasi yang berbeda, dengan kebijakan berbeda mengatur kontrol informasi (atau memang tidak ada kebijakan sama sekali), akan memiliki masalah pembagian, dan masalah akan bertambah buruk jika pembagian dilakukan pada tingkat kasar suatu laman web, dokumen atau website, bukan pada tingkat halus dari informasi individual. Di sisi lain tangan, adalah sama benar bahwa ada sejumlah platform, protokol dan arsitektur yang memfasilitasi keamanan informasi, tetapi tidak banyak digunakan. Dan kendala yang ditambahkan adalah infrastruktur yang harus mengaktifkan keamanan, privasi dan kepercayaan tanpa mengganggu pengguna dengan konstan informasi atau permintaan untuk izin. Pemerintahan Web tidak dapat diabaikan oleh Web Science. Kita mulai diskusi kita dari aspek ruang dengan proses penetapan standar dan
pembuatan kebijakan.


6.1 Standar dan kebijakan

Pengaturan standar memungkinkan industri besar menghemat biaya dan begitu juga untuk hal baik lainnya. Tapi ada perangkap tersembunyi. Mungkin satu atau dua perusahaan besar memiliki kemampuan dalam industri untuk mendominasi standar, dan memastikan bahwa pesaing yang lebih kecil dan pemasok mengikuti. Negosiasi standar, di mana semua orang lebih suka standar daripada tidak standar, kemungkinan untuk menghasilkan yang terbaik dalam suatu industri, dan keberadaan badan yang efektif, dirasakan menjadi netral, adalah salah satu aspek penting dari penguasaan web.

Dalam permasalahan web, standar diperlukan untuk menjamin pelestarian sifat esensialnya arsitektur, dikombinasikan dengan desentralisasi, fleksibilitas dan kegunaan, dalam lingkup di mana aspek sosial digunakan belum tetap. Berbagi informasi secara tradisional telah terbatas, dan tertanam dalam konteks dipahami dengan baik. Jadi, misalnya, berbagi foto secara tradisional melibatkan menyerahkan fisik objek. Lintasan suatu objek relatif mudah dilacak. Penyalahgunaan objek relatif terdeteksi. Dan bahkan jika yang sebenarnya bersalah karena telah menyalahgunakan tidak dapat ditemukan, individu yang bersalah (yaitu orang yang meminjamkan foto tanpa izin) dapat ditemukan. Teknologi digital telah mengubah semua itu. Berbagi foto digital memfasilitasi penggandaan besar-besaran dan penyebaran dengan cara yang singkat ke pengguna lain.


Standar dan kebijakan yang dirancang untuk membuat perilaku yang baik lebih mudah dan oleh karena itu lebih mungkin diperlukan. Kebijakan tersebut, biasanya, akan menentukan siapa yang dapat menggunakan atau memodifikasi sumber daya, dan dalam kondisi apa. Kebijakan kesadaran melibatkan dan memastikan pengguna telah mengakses dan memahami pandangan kebijakan yang terkait dengan sumber daya Web tertentu, yang tidak hanya akan mendukung perilaku yang baik namun memungkinkan untuk mengidentifikasi pelanggaran dan akar dari perilaku buruk.

Kebijakan kesadaran, karena konteks tertentu dari Web, harus sangat berbeda dari pendekatan saat ini untuk informasi keamanan dan kontrol akses, yang memanfaatkan mekanisme yang memerlukan koordinasi dan pemeliharaan yang mahal dan oleh karena itu sangat menentukan untuk penggunaan umum di web. Bahkan pengontrolan password secara rutin bisa menjengkelkan.

Web memerlukan deskripsi kreatif langkah-langkah keamanan, bukan dari resep dan mekanisme, dan sejumlah pendekatan telah telah dikembangkan untuk menyusun kebijakan. Pada awalnya telah dibuat infrastruktur yang sesuai untuk desentralisasi dan demokrasi web, tetapi masih banyak yang harus dilakukan untuk menjamin transparansi dan akuntabilitas digunakannya informasi secara benar.
6.2 Hak Cipta
Hak Cipta adalah hak khusus bagi pencipta untuk mengumumkan atau memperbanyak ciptaannya. Termasuk ciptaan yang dilindungi adalah ciptaan dalam bidang ilmu pengetahuan, sastra dan seni.
Berdasarkan Undang-Undang Nomor 19 Tahun 2002 Tentang Hak Cipta :
Hak Cipta adalah hak eksklusif bagi Pencipta atau penerima hak untuk mengumumkan atau memperbanyak Ciptaannya atau memberikan izin untuk itu dengan tidak mengurangi pembatasan-pembatasan menurut peraturan perundang-undangan yang berlaku.(Pasal 1 ayat 1)
Hak cipta diberikan terhadap ciptaan dalam ruang lingkup bidang ilmu pengetahuan, kesenian, dan kesusasteraan. Hak cipta hanya diberikan secara eksklusif kepada pencipta, yaitu "seorang atau beberapa orang secara bersama-sama yang atas inspirasinya lahir suatu ciptaan berdasarkan pikiran, imajinasi, kecekatan, keterampilan atau keahlian yang dituangkan dalam bentuk yang khas dan bersifat pribadi".
Hak cipta merupakan salah satu jenis hak kekayaan intelektual, namun hak cipta berbeda secara mencolok dari hak kekayaan intelektual lainnya (seperti paten, yang memberikan hak monopoli atas penggunaan invensi), karena hak cipta bukan merupakan hak monopoli untuk melakukan sesuatu, melainkan hak untuk mencegah orang lain yang melakukannya.
Hak cipta berlaku pada berbagai jenis karya seni atau karya cipta atau “ciptaan”. Ciptaan yaitu hasil setiap karya Pencipta dalam bentuk yang khas dan menunjukkan keasliannya dalam lapangan ilmu pengetahuan, seni dan sastra. Ciptaan yang dilindungi adalah Ciptaan dalam bidang ilmu pengetahuan, seni dan sastra.
SUBYEK HAK CIPTA
Pencipta
seseorang atau beberapa orang secara bersama-sama yang atas inspirasinya lahir suatu ciptaan berdasarkan kemampuan pikiran, imajinasi, kecekatan, keterampilan atau keahlian yang dituangkan dalam bentuk yang khas dan bersifat pribadi.
Pemegang Hak Cipta
Pencipta sebagai Pemilik Hak Cipta atau orang lain yang menerima lebih lanjut hak dari orang tersebut diatas.
Undang-undang yang mengatur Hak Cipta:
Ø UU Nomor 19 Tahun 2002 , Dalam undang-undang ini, pengertian hak cipta adalah “hak eksklusif bagi pencipta atau penerima hak untuk mengumumkan atau memperbanyak ciptaannya atau memberikan izin untuk itu dengan tidak mengurangi pembatasan-pembatasan menurut peraturan perundang-undangan yang berlaku” (pasal 1 butir 1).
Ø UU Nomor 6 Tahun 1982 tentang Hak Cipta (Lembaran Negara RI Tahun 1982 Nomor 15)
Ø UU Nomor 7 Tahun 1987 tentang Perubahan atas UU Nomor 6 Tahun 1982 tentang Hak Cipta (Lembaran Negara RI Tahun 1987 Nomor 42)
Ø UU Nomor 12 Tahun 1997 tentang Perubahan atas UU Nomor 6 Tahun 1982 sebagaimana telah diubah dengan UU Nomor 7 Tahun 1987 (Lembaran Negara RI Tahun 1997 Nomor 29)
6.3 Transgresif behavior
Dalam banyak kasus, terdapat saran untuk menghindari pelanggaran yang mungkin terjadi tapi tetap saja banyak pelanggaran yang masih terjadi , tapi kita harus selalu siap untuk perlombaan alat mesin pencari. Jadi, misalnya, kita sebut saja 'spamdexing', atau menempatkan kata kunci tertentu dalam dokumen sehingga meningkatkan data yang mungkin muncul dari mesin pencari atau apakah isi dari data mesin pencari tersebut tidak relevan, kurang menarik jika ada kebijakan pengambilan data dari mesin pencari yang berfokus pada struktur hyperlink daripada isi dari halaman.
contoh yang paling menonjol dari perlombaan senjata mesin pencari adalah kualitas terkenalnya mesin pencari tersebut. Jadi yang berpengaruh adalah pola penggunaan web pada Google, PageRank seharusnya beroperasi di dunia di mana terdapat agen dari web lain yang ingin menghancurkan Goolge itu sendiri. Pelajaran dari algoritma PageRank, atau gaya algoritma, yaitu kadang sering mengambil hasil pencarian untuk mempromosikan hal-hal yang di anggap tidak penting dan terlalu banyak "bagaimana caranya" dokumen dapat menjadi hal yang tidak di anggap tidak penting. Mantan direktur riset di Google Monika Henzinger menganggap ini sebagai tantangan penting untuk Google. Selama mendapatkan keuntungan karena selalu ada di halaman pertama dan paling banyak di ambil dan dilihat, perlombaan senjata mesin pencari akan terus terjadi, dan sulit membayangkan bagaimana tekniknya mesin pencari spamming bisa dibuat secara ilegal - setelah mereka memanfaatkan mekanisme kata kunci yang dapat membuat web yang sangat canggih.

Privasi adalah kebebasan pribadi. Contoh, ketika Anda mengirim surat kepada orang lain, tentu dengan amplop tertutup bukan? Walaupun mungkin isinya tidak penting. Lalu mengapa Anda tidak mengirimkannya dengan kartu pos? Dari contoh ini Anda tentu sudah bisa menarik kesimpulan yang intinya, Anda tidak ingin orang lain membaca surat Anda.

Di internet hal demikian sulit diperoleh. Karena e-mail yang Anda kirimkan adalah teks murni, orang lain bisa saja membaca surat Anda. Bagi yang berada di kantor dan koneksi ke internet dengan "proxy server" kantor, admin bisa kapan saja membaca isi surat yang Anda kirimkan. Lebih buruk lagi, e-mail Anda dapat dipalsukan, misalnya mengirimkan e-mail atas nama Anda kepada orang lain dan tidak ada yang bisa Anda lakukan untuk membuktikan bahwa e-mail tersebut bukanlah dari Anda.

Tip Menjaga Privasi Dalam Mengirim e-mail
Untuk mencegah hal demikian, diperlukan sebuah program yang dapat mengacak (enkripsi) e-mail Anda sekaligus melakukan verifikasi bahwa e-mail tersebut adalah benar-benar Anda sendiri yang mengirimnya. Program yang dimaksud adalah PGP (Pretty Good Privacy). Dengan PGP bukan saja surat Anda tidak dapat dibaca oleh pihak lain melainkan keabsahannya juga terjaga.

Hal lain yang perlu diperhitungkan dalam menjaga privasi adalah steganografi. Steganografi adalah seni menyembunyikan sesuatu ke dalam sesuatu. Penjelasan ini mungkin agak membingungkan. Tapi percayakah Anda jika e-mail Anda dapat disembunyikan di dalam file BMP atau WAV? Hal tersebut dapat dilakukan dengan steganografi. Jika Anda mengirimkan e-mail Anda dalam keadaan terenkripsi, maka mungkin seseorang dapat dengan sengaja memblokir e-mail Anda dan menghapusnya, karena kesal tidak dapat membaca e-mail Anda. Pesan Anda tidak akan pernah sampai.

Tapi bagaimana jika Anda mengirimkan e-mail biasa dengan body kosong bersubjek "foto reuni" dan lampiran berupa file BMP? Tentu orang akan berasumsi bahwa yang Anda kirim hanyalah foto dan tidak ada apa pun yang menarik untuk diperhatikan. Di lain pihak, rekan rahasia Anda mengetahui Anda mengirimkan e-mail lewat foto BMP tersebut dan melakukan de-enkripsi dengan software khusus steganografi, maka e-mail Anda selamat sampai tujuan dalam keadaan utuh. Hal ini dapat dikombinasikan dengan PGP, sehingga walaupun seseorang tahu bahwa Anda mengirimkan e-mail lewat file gambar, namun tetap tidak dapat mengetahui apa yang telah Anda tulis.

Cara Melindungi Privasi Anda

Untuk melindungi privasi Anda ada beberapa cara yang dapat diterapkan berdasarkan layanan internet yang Anda gunakan.Jika Anda menggunakan WWW, maka gunakanlah "web proxy". Sedangkan e-mail, maka gunakan "remailer" atau "nym account". Dan untuk IRC, gunakan "Wingate proxy".


Privasi atau Tidak?
Pertanyaan apakah privasi perlu diterapkan di internet atau tidak selalu menjadi kontroversi. Pada satu sisi, privasi adalah hak asasi, di lain sisi fasilitas untuk ini sering disalahgunakan dengan tujuan iseng atau jahat, misalnya posting anonim dengan pesan yang disertai kata-kata yang menghasut.

Pemerintah Amerika Serikat sangat anti terhadap masalah privasi. Ini terbukti dari larangan ekspor teknologi enkripsi bit tinggi ke luar AS. Mereka ingin mengendalikan semua e-mail yang masuk atau keluar dari AS dengan cara menyensornya. Dikhawatirkan, jika teknologi enkripsi bit tinggi (di atas 64 bit) tersebar ke luar AS, maka agen rahasia AS akan sulit melacak dan mengawasi e-mail yang akan mereka monitor terhadap pihak-pihak tertentu di luar AS yang dicurigai melakukan tindak kejahatan tingkat tinggi. Enkripsi dengan bit tinggi hanya boleh dipakai di dalam AS karena masih dalam wewenang pemerintah AS.
Identity
Saat ini orang sangat dimanjakan oleh kemajuan teknologi. Perkembangan teknologi memungkinkan orang untuk berkomunikasi maupun bertransaksi dengan lebih cepat dan lebih murah. Dari 30 juta masyarakat di Indonesia mayoritas sudah banyak yang mengakses internet dan mengenal namanya jaringan sosial untuk berkomunikasi seperti Facebook, Yahoo!Messenger, Aim, Windows Live dan berbagai macam fasilitas yang memudahkan kita berinteraksi melalui media internet. dan dari itu pula
banyak kejahatan yang dilakukan di media internet tersebut. Pencurian identitas secara gamblang berarti seseorang mengambil kartu pengenal ataupun segala jenis pengenal lalu digunakan pada dirinya sebagai identitas pengenal orang yang dicuri tersebut.

Hingga saat ini banyak terjadi pencurian identitas seseorang untuk mencari tujuan ekonomi yang mereka inginkan ataupun hanya bersifat motif dendam semata dimana dia merusak image orang tersebut atau juga sekedar iseng belaka dan juga pencurian identitas tersebut bertujuan untuk melakukan transaksi atas nama korban. motif lain yang masih berkaitan dengan ekonomi dengan berusaha menyusupkan malware ke dalam sistem komputer atau telpon seluler anda yang bertujuan untuk mengambil data penting seperti informasi kartu kredit maupun nomor rekening bank.

Modus pencurian identitas tersebut dibagi menjadi 2:

1. Meniru identitas dengan mengunakan alamat email, nama lengkap, tanggal lahir, nomor telpon, alamat rumah, dan berbagai macam info yang melekat pada pribadi seseorang. Teknik yang menganti nama yang melekat pada sebuah nama alamat email atau dengan membuat akun yang sama berdasarkan informasi identitas yang dicurinya.

2. Dengan langsung membajak akun korban, jadi praktis semua data yang ada diakun tersebut dikuasai oleh penjahat. Teknik ini ada dua cara yakni pertama akun yang dibajak tidak diubah kata sandi sehingga cendrung tidak ketahuan oleh pemilik nya. Atau akun tersebut dikuasai oleh penjahat,kedua kata sandinya diubah sehingga pemiliknya tidak bisa mengaksesnya lagi. Yakni dengan menebak-nebak kata sandi atau juga dengan aplikasi pencurian.

Cegah dengan Emapat langkah:
1. Jangan Umbar data Pribadi.
Pencurian identitas biasanya memanen informasi dari jejaring sosial, dan memang banyak yang memasang berbagai macam info pribadi dalam profil pengguna. Ada baiknya berhati-hati dalam menuliskan data pribadi dalam jejaring sosial, lebih baik isikan data yang tidak detail.

2. Jangan mengunakan kata sandi yang sama ubah kata sandi secara rutin.
Kebanyakan orang menggunakan kata sandi yang sama untuk berbagai layanan internet yang bebeda. Ini tentu saja mempermudah para pembajak akun untuk membajak semua akun yang dimiliki. Biasakanlah untuk mengubah kata sandi secara rutin agar sulit di tebak oleh penjahat.

3. Jangan mudah percaya dengan orang lain. sekalipun itu saudara.
Metode phishing bekerja dengan memberikan pesan atau email berisi laman yang mewajibkan kita melakukan login. Lebih baik hindari mengunjungi laman yang mencurigakan. jangan tambah aplikasi secara sembarangan di jejaring sosial.

4. Berpikir dengan akal sehat.
Teknik para penjahat untuk membajak akun adalah mengandalkan emosi dasar yang ada di diri tiap manusia. Rasa penasaran, ingin tahu dan keserakahan. Memancing untuk login dengan iming-iming ada foto yang membuat penasaran misalnya, harus memasang aplikasi tertentu agar bisa menerima uang dari internet tanpa perlu bekerja keras. dengan akal sehat kita bisa mengontrol diri dari hal-hal tersebut.



Saat ini pencurian Identitas bisa dihindari dengan menggunakan Software Internet Sekuriti seperti Trend Micro Internet Security (TIS atau TISPRO). Dengan menggunakan modul anti spyware di TIS/TISPRO, informasi pribadi dapat terlindungi. Teknologi anti-spyware dapat menjaga informasi personal dan privasi terhadap spyware, rootkit, dan software berbahaya lainnya. Sedangkan dengan menggunakan modul Web Threat Prevention, TIS/TISPRO mampu melindungi terhadap ancaman web, menghindari penipuan phishing online yang mencoba untuk mencuri kartu kredit atau nomor rekening bank. Dengan automatic update TIS/TISPRO mampu untuk mengidentifikasi situs-situs berisiko terbaru.

6.5 ekonomi informasi dan komunikasi

Sebuah situs tidak hanya sebuah ruang politik, tapi juga sebuah ruang ekonomis, karena ilmu pengetahuan memiliki harga. Walaupun dengan politik sebuah lingkungan online tidak dapat mengikuti aturan-aturan ekonomi yang telah ada. Sebuah struktur dasar dari industri informasi dengan biaya operasi yang relatif besar (untuk mencari sumber informasi) dan biaya marginal yang tak dapat diabaikan (setiap duplikat dari informasi yang sepele untuk diciptakan) memberi kesan bahwa seperti monopoli alami. Sekalinya biaya tetap telah ditanggung oleh sebuah firma, mereka dapat membuat sebuah firma keluar dari pusaran selama mereka merintangi pendapatan firma lain dari informasi yang dibutuhkan.
Sebuah pekerjaan harus sampai selesai untuk menentukan sejauh mana sketsa ekonomi benar; contoh, sepertinta firma online saling berkompetisi dalam harga online, yang membuat harga online relatif murah. Untuk menjaga 'sketsa' itu tetap di jalur yang benar, bagaimanapun, pertanyaan dari regulasi monopoli alami ini harus benar-benar diperhatikan.

Pencarian dapat menjadi masalah. Di mana ada kemacetan informasi, selalu ada peluang monopoli. Perusahaan-perusahaan pencari besar menghadapi peningkatan pengawasan (yang sama dengan perusahaan lain di bidang komputasi) sebagai media yang harus berhadapan dengan masalah persyaratan politik, di mana yang paling dikenal yaitu di Cina.
6.6 Sebuah hegemoni liberal?
Sebuah hasil terakhir adalah web merupakan sebuah ruang yang dirancang untuk memperoleh arus informasi, dan menciptakan peluang kerjasama serta kolaborasi. Hal tersebut menimbulkan pertanyaan mengapa arus informasi bebas merupakan hal yang baik, dan jawabanya cukup sederhana, yaitu hal tersebut baik agar memiliki kebebasan untuk mengekspresikan diri supaya dapat mengejar kekuasaan dan proyek. Tanpa adanya hambatan kritik dari pemerintahan dan pusat-pusat kekuasaan lainnya yang cenderung mengarah pada pemerintahan yang lebih baik, informasi dapat mengendalikan demokrasi. Kedua alasan ini memiliki akar dalam liberal, individualis pandangan dunia, dalam tradisi locke, mill dan rawls. Mungkinkah web adalah artefak liberal?

Tentu saja ada oposisi terhadap web dari berbagai sumber(sebagian besar sumber-sumber mengatakan lebih dari kesenangan untuk mempekerjakan web sebagai alat untuk berorganisasi,komunikasi dan diseminasi). Banyak liberal pemerintah yang membatasi penggunaan warga mereka dari web, seringkali menggunakan adaptasi dari teknologi firewall untuk menciptakan dampak besar intranet di dalam perbatasan mereka. Bahkan demokrasi non-liberal memiliki sebuah masalah dengan web. Sebagai contoh, pemerintahan Singapura memiliki sentuhan yang relatif ringan dalam pengaturan internet, tetapi masih blok 100 atau situs porno, membutuhkan website politik dan agama untuk didaftarkan dan berlisensi dengan broadcasting singapura otoritas, dan larangan aktivitas pemilu di web selama kampanye pemilihan, walaupun ia memiliki visi yang kuat dari berbasis pengetahuan ekonomi dan merupakan salah satu pemerintahan yang paling antusias di dunia berkaitan dengan IT.

Di dunia aktivitas non-pemerintahan, web juga telah dilihat sebagai agen globalisasi, sehingga dari web telah dikondisikan oleh pandangan politik penulis tentang tren itu. Banyak yang melihat internet sebagai surga anarki yang indah dibandingkan dengan web, dengan itu website mencuranginya dan menarik masa, yang telah menghancurkan semua dan menormalisasi dunia online. Pemasaran telah menggantikan demokrasi. Dalam wacana, neologisme seperti ‘cyberhegemony’ dan ‘cyberdependency’ berlimpah.

Cara web untuk menjadi kontributor ke global, pengembangan kesejahteraannya harus memilih jalan melalui sejumlah perdebatan yang rumit seperti, pentingnya bahwa web tidak menjadi monokultural global, disamping itu juga menghindari alternatif dekomposisi ke mini web beberapa cultish dengan sedikit atau tidak ada koneksivitas di antara keduanya. Kehormatan untuk orang-orang terpandang dan pertahanan yang tepat dari seseorang selalu menjadi suatu kesulitan untuk menyerang ke dalam setiap bidang kegiatan manusia. Pada suatu saat kita dikejutkan web dengan kesuburan konektivitasnya. Hal itu sangat penting untuk dipertahankan. Ini kemungkinan akan menjadi fraktal struktur web, jika dapat dipupuk, akan menjadi bagian dari sebuah solusi. Kita juga perlu memahami cara yang digunakan web dalam negara berkembang, daripada fokus pada demokrasi barat, untuk memastikannya dapat berfungsi sebagai luas seperangkat konstituen sebagai kemungkinan.

Mengingat semua kekhawatiran, mungkin mengherankan bahwa pemerintah amerika serikat baru-baru ini datang di bawah tekanan tentang keunggulan yang berperan dalam pemerintahan web, meskipun jelas keberhasilan internet dan web sejauh ini. PBB kelompok kerja di internet 2005 melaporkan pembuatan sejumlah rekomendasi yang semua stakeholder harus dilibatkan dalam tata kelola internet. Ini mungkin mengubah liberalisme dari web. Disebutkan kemungkinan efek ini pada web sendiri tidak diketahui.


BAB 7
Teks ini merupakan serangkaian pendapat memahami web. Kami berpendapat bahwa pendekatan-pendekatan ini dapat diatur menjadi kerangka kerja. Kerangka kerja merupakan ilmu untuk disiplin. Dalam ilmu ini kita perlu menyelidiki arsitektur dan perlu memahami arsitektur di tepat tingkat abstraksi. Sebuah ilmu web berisi perdebatan sendiri tentang metodologi yang tepat. Kami berpendapat pada panjang yang bergerak dari centricWeb-dokumen ke data yang lebih menyeluruh Web cenderung memerlukan lebih banyak dengan cara teknologi semantik. Tidak sedikit karena kenyataan bahwa transparan dan tidak ambigu integrasi data tuntutan heterogen jelas deskripsi semantik. Sejauh mana ontologi akan memberikan mekanisme luas untuk mencapai mediasi dibahas. Saat ini trend dalam penelitian Web akan mengubah sifat Web itu sendiri. Apakah ini adalah munculnya layanan Web, model baru berbagi konten seperti P2P, permintaan untuk personalisasi, luas otomatis Natural Language Processing atau munculnya komputasi mobile, masing-masing topik akan komponen yang sah Sains Web kami.
Kebutuhan untuk peneliti dalam matematika dan fisika, biologi dan ekonomi untuk membuat umum menyebabkan insinyur dan ilmuwan komputer untuk membantu memperkaya pemahaman kita sistem informasi ini besar desentralisasi. Kami belum mengatakan banyak tentang bagaimana memahami dan menganalisa Web dapat menyebabkan untuk wawasan penting untuk disiplin ilmu lainnya. Tapi ini hampir terjadi. Kolaborasi serius ilmiah tidak pernah merupakan salah satu cara. Kami telah menghabiskan waktu mengartikulasikan tantangan yang Web Science menimbulkan dari sudut pandang moral dan sosial. Web mungkin lebih dari yang lainnya baru-baru ini manusia membangun disertai dengan sejumlah masalah termasuk privasi dan perlindungan, akses dan keragaman, kontrol dan kebebasan. Struktur yang kami rancang, insinyur dan penelitian, dan temuan yang muncul melalui analisis, sering akan memiliki implikasi sosial yang kuat. Kami ingin bahwa komunitas Web Ilmu sadar secara sosial, informasi dan bila perlu proaktif. Akhirnya, kami percaya bahwa argumen tentang apakah ilmu harus dasarnya analitik yang steril. Kami membutuhkan ilmu menganalisis dan mensintesis. Kami juga menduga ada seni lebih untuk ilmu pengetahuan dan ilmu pengetahuan untuk seni daripada sering diakui. Kami lebih dari senang untuk mengakui bahwa. Kami juga percaya bahwa ia memiliki beberapa pertanyaan yang menantang dan menarik dari abad ke-21.

Tidak ada komentar:

Posting Komentar