百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Java中字符串的长度值(java 字符串的长度)

lipiwang 2025-04-06 18:01 6 浏览 0 评论

我第一次知道:

在 UTF - 8 编码中,英文字符和空格占 1 个字节,中文字符通常占 3 个字节。

在 GBK 编码中,英文字符和空格占 1 个字节,中文字符占 2 个字节。

上代码,看图:


public static int strGetCnLength(String str) {
    if (str == null) {
        return 0;
    }
    int result = 0;

    for (int i = 0; i < str.length(); ++i) {
        char c = str.charAt(i);
        // 判断字符是否为中文字符(Unicode 范围)
        if (charIsChinese(c)) {
            result += 2;
        } else {
            result += 1;
        }
    }
    return result;
}

private static boolean charIsChinese(char c) {
    // 中文字符的 Unicode 范围
    Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
    return ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS
            || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
            || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A
            || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B;
}

public static int strCodePointLength(String text) {
    if (text == null || text.isEmpty()) {
        return 0;
    }
    return text.codePointCount(0, text.length());
}

public static int strGetBytesLength(String text,String charsetName ) {
    if (text == null || text.isEmpty()) {
        return 0;
    }
    try {
        byte[] utf8Bytes = text.getBytes(charsetName);
        return utf8Bytes.length;
    }
    catch(Exception err){
        err.printStackTrace();
        return -1;
    }
 }

public static void main(String[] args) {
    String testStr = "Hello 世界";
    int len = strGetCnLength(testStr);
    System.out.println("字符串长度(中文算 2 个): " + len);
    len = strCodePointLength(testStr);
    System.out.println("strCodePointLength: " + len);
    len = strGetBytesLength(testStr,"UTF-8");
    System.out.println("strGetBytesLength(UTF-8): " + len);
    len = strGetBytesLength(testStr,"GBK");
    System.out.println("strGetBytesLength(GBK): " + len);
}

输出:

字符串长度(中文算 2 个): 10
strCodePointLength: 8
strGetBytesLength(UTF-8): 12
strGetBytesLength(GBK): 10

豆包给的解释:

以下是对这段 Java 代码输出结果的详细分析与实际运行后的输出:

代码功能概述



这段 Java 代码定义了四个静态方法用于计算字符串的不同长度:



  1. strGetCnLength:将中文字符计为 2 个字符长度,其他字符计为 1 个字符长度,计算字符串的总长度。
  2. strCodePointLength:使用 codePointCount 方法计算字符串中实际的字符数量(考虑 Unicode 代理对)。
  3. strGetBytesLength:将字符串按照指定的字符编码转换为字节数组,并返回字节数组的长度。
  4. main 方法:用于测试上述三个方法,使用字符串 "Hello 世界" 作为测试用例,并分别调用三个方法计算不同类型的长度,然后将结果打印输出。

输出结果分析



  • strGetCnLength 方法:字符串 "Hello 世界" 中,英文字符和空格共 6 个,每个计为 1 个长度;中文字符有 2 个,每个计为 2 个长度。所以总长度为 6 * 1 + 2 * 2 = 10。
  • strCodePointLength 方法:该方法计算字符串中实际的字符数量,字符串 "Hello 世界" 共有 8 个字符(包括英文字符、空格和中文字符)。因此结果为 8。
  • strGetBytesLength 方法(UTF - 8 编码):在 UTF - 8 编码中,英文字符和空格占 1 个字节,中文字符通常占 3 个字节。字符串 "Hello 世界" 中,6 个英文字符和空格共占 6 个字节,2 个中文字符共占 2 * 3 = 6 个字节。所以总字节长度为 6 + 6 = 12。
  • strGetBytesLength 方法(GBK 编码):在 GBK 编码中,英文字符和空格占 1 个字节,中文字符占 2 个字节。字符串 "Hello 世界" 中,6 个英文字符和空格共占 6 个字节,2 个中文字符共占 2 * 2 = 4 个字节。所以总字节长度为 6 + 4 = 10。


问:

java代码中,用utf-8存储,数据库中一个中文字占用几个字节?


相关推荐

《每日电讯报》研发数字工具,教你更有效率地报道新闻

为鼓励新闻编辑部持续创新,《每日电讯报》正在尝试有战略地研发数字工具。网站的数字媒体主任马尔科姆o科尔斯(MalcolmColes)表示,《每日电讯报》正试图去“创建一些可持续资产”,以便于让记者们...

html5学得好不好,看掌握多少标签

html5你了解了多少?如果你还是入门阶段的话,或者还是一知半解的话,那么我们专门为你们收集的html5常用的标签大全对你就很有帮助了,你需要了解了html5有哪些标签你才能够更好的。驾驭html5...

前端分享-少年了解过iframe么(我想了解少年)

iframe就像是HTML的「内嵌画布」,允许在页面中加载独立网页,如同在画布上叠加另一幅动态画卷。核心特性包括:独立上下文:每个iframe都拥有独立的DOM/CSS/JS环境(类似浏...

做SEO要知道什么是AJAX(人能看到但搜索引擎看不到的内容)

一个明显的,人能看到但搜索引擎不能看到的内容是AJAX。那么什么是AJAX呢?其实,了解过的基本上也都清楚,AJAX不是新的编程语言,而是一种使用现有标准的新方法。AJAX最大的优点是在不重新加...

介绍最前沿的人工智能创新,‘无反向传播’神经网络训练方法?

图像由GoogleImageFX生成前言:本文整理自NoProp原始论文与实践代码,并结合多个公开实现细节进行了全流程复现。对神经网络训练机制的探索仍在不断演进,如果你也在研究反向传播之...

说说我们对HTML6的期许(对html的看法)

HTML5概述HTML5是HTML语言最受欢迎的版本之一,它支持音频和视频、离线存储、移动端、和标签属性等等。还提供了article,section,header这样的标签来帮助开发者更好...

浏览器中在线预览pdf文件,pdf.mjs插件实现web预览pdf

背景:本来只是淘宝上卖卖袜子,想着扩展一下业务,准备做同名“来家居”海外袜子馆外贸项目,碰到pdf在线预览的需求,就找了pdf.js插件进行实践后把此方法记录下来,可以通过多种方法来实现,每种方法都有...

SVG 在前端的7种使用方法,你还知道哪几种?

本文简介点赞+关注+收藏=学会了技术一直在演变,在网页中使用SVG的方法也层出不穷。每个时期都有对应的最优解。所以我打算把我知道的7种SVG的使用方法列举出来,有备无患~如果你还...

HTML5常用标签大全(html5em标签)

HTML前端开发最终取决于掌握标签的多少HTML大概有七八百个标签楼主这里给大家总结了下HTML常用标签标签描述<!--...-->定义注释。<!DOCTYPE>定义文档类型...

&quot;伪君子Snoop Dogg!&quot;... WHAT?| MetroDaily 24/7

TUE.01-新作品-虽说年纪大了会有点糊涂,但是最近SnoopDogg的这波操作实在是让粉丝们有点迷,甚至有人表示没想到他是这样的"伪君子"......而这一切都源于他近日在IG上Po出的一...

史努比snoopy卡通手机壁纸屏保(史努比壁纸无水印)

...

莎夏·班克斯盼望表哥Snoop Dogg为其作出场曲

NXT女子冠军莎夏·班克斯(SashaBanks)近日接受了迈阿密先驱报采访,访谈纪要如下:关于她出众的形象:“我一向喜欢与众不同。为了能让人眼前一亮,我的装束总是非常前卫、非常抢眼,这样才能让观众...

喜欢Snoop!全球第一间「史努比博物馆」海外分馆在东京!

1950年起,由美國漫畫家CharlesM.Schulz創作的作品《Snoopy》史努比,其鮮明的可愛角色與幽默的劇情內容,至今仍成為許多大朋友與小朋友心中的最愛。為了紀念作者所設立的全球首...

Vetements 推出 Snoop Dogg 肖像「天价」T-Shirt

Vetements的CEOGuramGvasalia早前才透露品牌经营策略的秘密–Vetements如何成为人人热议的话题品牌。但似乎他仍有更多需要解释的东西–这个法国奢侈品牌最新...

狗爷Snoop Dogg的《I Wanna Thank Me》巡回演唱会旧金山站

西海岸匪帮说唱歌手SnoopDogg在《IWannaThankMe》巡回演唱会旧金山站表演(图片来自ICphoto)西海岸匪帮说唱歌手SnoopDogg(图片来自ICphoto)西海...

取消回复欢迎 发表评论: